Уже есть - http://multiparser.com
Яндекс долго не хотел индексировать его, поэтому сделал еще и ru.
Оба сайта используют одну базу данных.
Если бы был доход, я бы не создавал эту тему. Сервису всего месяц ) Его нужно раскручивать, чтобы был доход.
К сожалению не получил вашего сообщения, вообще предложения лучше присылать на почту multiparser@gmail.com, если можно,краткое резюме в свободной форме.
Ну да ) Все понимаю. Я - программист.. организация бизнеса дается с трудом ) Но все равно - спасибо за совет.
Нет, скрипт писал полностью сам. Используется база синонимов Wordnet, она была расширена мной чтобы при обработке учитывалась морфология. Иногда для слова подбираются неправильные синонимы потому что, например лексема "works" может быть как существительным (мн. число) так и глаголом. Набор правил постоянно дополняется. В ближайшие 2-3 дня я добавлю возможность обновить список синонимов для слова если он не будет устраивать пользователя.
Спасибо за Ваш комментарий.
mimin добавил 15.01.2009 в 01:32
Была исправлена ошибка при которой не распознавались некоторые лексемы (с окончаниями ing,s,ed). На днях будет готова обещанная кнопка перебора синонимов.
mimin добавил 15.01.2009 в 01:34
Была исправлена ошибка из-за которой не распознавались некоторые лексемы (с ing,ed и s) окончаниями. На днях будет обещанная кнопка смены списка синонимов.
Перед поиском синонимов определяется часть речи (статистически и с учетом контекста) просто расширяемый механизм правил еще не до конца заполнен. Насчет "Love = Fuck = Screw" :) за основу была взята база Wordnet я так и знал что будут нарекания по поводу такого рода синонимов, но синонимы они и есть синонимы ). ing распознается, для достаточно большого количества слов (как и 2,3 форма глаголов). Возможно частота замены была 2 и следовательно каждое второе слово пропускается, попробуйте поставить 1.
Спасибо за Ваше замечание по поводу стеммера, на самом деле это альфа версия, поэтому и стоимость весьма низкая для аналогов. Скрипт постоянно совершенствуется и дорабатывается так как целью является создания хорошего генератора контента.