Hkey

Hkey
Рейтинг
222
Регистрация
30.09.2006
Интересы
Java

еще актуально

Что вы хотите увидеть в новой версии?

стукнул...

1. Прогон по катам

2. Прогон по LE

3. Установка скрипта обменика и рассылка писем

В задаче генерирования < 5 вариантов текстов.

каждому синониму приписываеться какое то число (вероятность правильности). Потом учитывая длину шингла программа с помощью Alfa-Beta перебора выбирает оптимальный вариант учитывая, что как можно большее к-во шинглов должно быть разными в текстах и вероятность не правильного употребления синонима должна быть минимальной.

Alfa-Beta нельзя обаботать весь текст и текст обрабатываеться кусками. При увеличении длины куска увеличиваеться время обработки в геометрической прогрессии, а при уменьшении хуже становиться выбранный вариант. Я работаю над этой проблемой, пытаясь считать взахлест и выбирать метрики, но это вызывает огромный ряд сложностей.

kevindark, смею поинтересоваться, что представляет ваш синомайзер, о котором столько слухов.

Зачем береться качаеться 50 гигов текстов. И благодаря им производиться анализ окружения. Даже не анализ а бракование синонимов не вписывающихся в данный контекст.

+ еще штук 40-50 эвристик.

При регестрации в каталогах от Айскрима по одмому из тарифных планов он генерирует описания и названия.

Скрипт дело 5-6 минут главное таблица синонимов. Но ничего хорошего он выдавать не будет. Ему нужно много гигов текстов для анализа правильности употребления слова. А для поиска в нескольких гигах нужен проостой кеширующий поисковик и много оперативной памяти.

Одесса!!!!!

Всего: 2639