Ура. Дописал свой синонимайзер.

snoopckuu
На сайте с 26.02.2006
Offline
34
#141

MaHbRk, именно поэтому и сделано 2 словаря.

лингво для ручного подбора, а обработанный в ручную маленький словарь для автомата.

На тупняк базы сливать? - покажите где, многое пришлось парсить из ворда, многое собирать из инедкса nutch'a(открытый поисковой движок.)

Может зря всё? Где качать? :)

Разработчик поисковых систем и алгоритмов. Я умнее яндекса. Мой синонимайзер. (http://se.o0o.ru)
MaHbRk
На сайте с 07.04.2008
Offline
12
#142
snoopckuu:
MaHbRk, именно поэтому и сделано 2 словаря.
лингво для ручного подбора, а обработанный в ручную маленький словарь для автомата.
На тупняк базы сливать? - покажите где, многое пришлось парсить из ворда, многое собирать из инедкса nutch'a(открытый поисковой движок.)
Может зря всё? Где качать? :)

можем ченьджнутся базами синонимов. У меня на 96464 строк(в строке от 1-10 слов)

если есть небольшая но более менее..буду рад:)

snoopckuu
На сайте с 26.02.2006
Offline
34
#143

MaHbRk, у меня базы уникальные собраны мной руками.

Да и в любом случае обмен мне не интересен.

MaHbRk
На сайте с 07.04.2008
Offline
12
#144
snoopckuu:
MaHbRk, у меня базы уникальные собраны мной руками.
Да и в любом случае обмен мне не интересен.

хозяин барин...

snoopckuu
На сайте с 26.02.2006
Offline
34
#145

УРА! Вышли обновления.

  • Оптимизированы SQL запросы.
  • Улучшена морфологическая обработка.
  • Зализан интерфейс.

В ближайшие несколько недель появится новый алгоритм склонения. Их можно будет выбирать 1 или 2 или ставить 1 приоритетным, а за тем 2 или наоборот. Так же будет подключен стэммер портера.

И синонимайзер уже разделится на версии с различными морфологическими базами.

Ещё одна хорошая новость, теперь получать тестовый доступ будет удобнее и быстрее, заявку можно оставить прямо с сайта. Там же открылся FAQ с ценами, услугами и с часто задаваемыми вопросами.

http://se.o0o.ru/

P.S. Оцените мою капчу. :)

snoopckuu
На сайте с 26.02.2006
Offline
34
#146

Добавил стэммер портера. За обновлениями на почту.

SL
На сайте с 27.07.2007
Offline
56
#147

<стэммер портера

что это такое?

Интересует алгоритм работы данного синонимайзера, реализаций таковых существует дохрена, но у вас существенная цена. Вот и интересны возможности синонимайзера. Есть ли у него игнорирование замены слов в крылатых фразах, учитывание части речи, и так далее. Куча отзывов конечно хорошо. Но почему не написать то что он умеет?

в виде

-игнорировать замену в крылатых фразах

-игнорирование английских слов

и тд. это "не спалит" ваш парсер, но очень поможет людям в выборе синонимайзера!

PS http://se.o0o.ru/, заполнил) каптча ништяк! надеюсь глянуть демку этого монстра!

Koreps
На сайте с 30.03.2006
Offline
110
#148

Извиняюсь за оффтоп, но капча очень понравилась)

Partnerkin.com (http://partnerkin.com) - кто над кем в партнерках.
snoopckuu
На сайте с 26.02.2006
Offline
34
#149

Koreps, спасибо.

st@l][ED,

1. http://en.wikipedia.org/wiki/Stemming

2. - игнорирование замену в крылатых фразах( функция отключена из-за высокой нагрузки при её использовании. Планируется оптимизация и включение её в след. версиях.)

- игнорирование замены английских слов в русском синонимайзере. Язык выбирается в правом верхнем углу. Тоесть синонимайзер есть пока на 2-х языках русский и английский.

SL
На сайте с 27.07.2007
Offline
56
#150

snoopckuu cпасибо за ответ!

морфология, стэммер это круто!

Можно получить демку? ЛС отослал

И ещё вопрос, какие требования к хостингу для установки скрипта? или нужен сервер?

st@l][ED добавил 22.05.2008 в 18:01

Протестил.

В общем я расчитывал этот продукт применить в одной своей идеи, где требуется авто режим.

Но в данном продукте он меня не порадовал...

Обо всём по-порядку. Как я понял в демке существуют несколько режимов работы:

1) ручной правки, где он выводит к каждому найденному слову список возможных замен. Очень данный режим не плох для обработки реферата. Ибо преподы и учителя палят тем что вводят часть текста в поиск яндекса, а тут то синонимы... Больше применения данного режима я не вижу.

2) дальше нашёл режим авто маленьких текстов, с надписями выбор базы: лингво и основная.

НО! работает там только то что уже было вбито по умолчанию "я иду по пути и наклонился головой вниз" Тогда внизу две кнопки работают. Когда как после того как введёшь другую фразу, кнопки "автомат по базе лингво и основной", работать перестают. Почему я не понял. Глюк ли это или ограничение демо версии?! Были опробованы основные три браузера(IE, Opera, Firefox все браузеры последних версий). Напрямую пропарсил пакетики, и начал посылать, скрипт выдаёт текс... Но вручную посылать http заголовки или писать свой скрипт обработки ломает)

3)дальше решим автозамены больших текстов. Он работает, но там одна кнопка. И какой режим работает(лингво или собственная БД разработчика) не понятно. И текст получается не очень. Заменяется маленький процент слов, кроме того те что заменяются имеют какой-то левый смысл...

Мой отзыв таков, что автор проделал большую работу, и ручной режим выбора замены синонимов близок к идеалу. А вот автоматический режим стоит ещё дорабатывать и дорабатывать. Так как его результаты плачевны... Возможно я не прав конечно и это всё издержки демо версии. Но то что я увидел, для автоматической замены подходит плохо.

Желаю автору удачи в дальнейшем развитие продукта!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий