Обновление до версии 0.0.5 (от 25.03.2009)
Из нового:
- изменен алгоритм подбора синонимов; синоним подбирается только с учетом рода, числа, и падежа;
- добавлен режим замены фраз(опция);
- добавлен/изменен режим поиска синонима по базовой форме слова(опция);
- добавлен режим "нормализации" результата(т.е. повторная коррекция, но уже в контексте предложений);
2 Maximalist: в силу того, что к каждому найденному(в базе) слову существует несколько синонимов, то и в текст вставляются они по рандому, т.е. не факт что с первого раза результат будет "удобочитаем".
Такой вариант выдан был с первого раза? Т.е. это - наилучший вариант?
Ввиду того, что база синонимов предпологает к одному слову несколько вариантов, то и конечный результат после корректора будет всецело зависит от случая/рандома)
P.S. Увы, но в силу нелинейности зависимостей в построении предложений не представляется возможным обучить машину "правильно" разобрать оное...ну или - пока не представляется )
Сегодня обновил версию(до 0.0.4).
Из "дополнений/обновлений":
- база синонимов подчищена и сокращена;
- "корректор" обучен поправлять прилагательные, местоимения и числительные (пока) по "следующему подлежащему" в предложении );
Ну к защите диссертации по русской филологии его никто и не готовит )))
Область же применения - и так очевидна.
P.S. Буду работать дальше...
Сегодня прикрутил обновленную базу синонимов(239673 слов.,1-3 синонима к слову макс.).
P.S.Отчасти это влияет на скорость "ответа", но не значительно.