garem

garem
Рейтинг
35
Регистрация
08.06.2006

Выпуск локальной версии не планируется, я так понял под Windows? Локально можно ставить и на Денвер.

С "ДР" обязательно разберусь.

Конечно снимает, и морфологическую и синтаксическую и поверхностно семантическую. Я не толкался от качества базы, база кстати используется одна из самых больших, упор делается на интеллектуальность алгоритма. И что Вы имете в виду под словом "обучить"? Нейронную сеть?

vtomas:
А планируется что то делать "руками"? Имею ввиду пополнять базу, самостоятельно выбирать синонимы (ручной режим), пакетный режим. :)

Естественно, ошибки будут, и их надо как-то править, пакетный -тоже будет, обработка html страниц - будет, вероятно подключение к основным CMS - тоже будет, пополнение базы - маловероятно, хотя может быть.

В бета версии одна кнопка - "пошел" )))

Sterh:
Чёт я не заметил в бесплатном варианте, что бы он в этих фразах вообще что либо заменил - мож просто не те кнопки тыкаю

На сайте старая версия. "Семантический" в паблик не поступит))))

Sterh:
ЗЫ: имхо - способ, опирающийся на разрушения шингла долго не проживет 😎

А он в Яндексе и не использовался никогда и не используется))))

PS Я не рекламирую что у меня в подписи

garem добавил 23.06.2009 в 11:17

Sterh:

"Хороша русская печь, что бы пироги печь" ;)
Или так: "На окраине поля стоял дом. Этот дом выпал из поля зрения проверяющего."

В тему омонимии морфологической, синтаксической и семантической нате еще предложение:

Косой с косами косил на косе косой косой

У меня так получается:

0 косой [chast] => С [gramems] => мр,ед,им

1 с [chast] => ПРЕДЛ [gramems] =>

2 косами [chast] => С [gramems] => жр,мн,тв

3 косил [chast] => Г [gramems] => дст,прш,мр,ед

4 на [chast] => ПРЕДЛ [gramems] =>

5 косе [chast] => С [gramems] => жр,ед,пр

6 косой [chast] => П [gramems] => жр,ед,тв,од,но

7 косой [chast] => С [gramems] => жр,ед,тв

sokol_jack:
А для отсеивания некорректных замен вполне хватит и n-gram :)

На личном опыте: для таких морфологически трудных предложений Триграмма не хватает. АОТ например, в трудных случаях морфологической неоднозначности использовал вместе с триграмом еще и Биграмм (как они его называют "лексикон"), но в конечном счете, все равно снять 100% морфологической омонимии не удается.

ps/ моя альфа версия "серверного2ссемантикой" справилась и с "домом" и с "печкой", использую аналогичный АОТу подход

PSS Да забыл сказать, наверно, всеж главное у синонимайзеров енто УНИКАЛЬНОСТЬ полученного материала и читабельность, остальное таки - второстепенно)))))))

Ну что сказать... Этот ..ила плюшевый продает мой нелицензионный скрипт, одна из старых версий. Его скрипт расположен сдесь http://vita-s.ru/index777.php, мой сдесь http://blogka.ru/syn1.php

Ссылка на мой топик /ru/forum/194464

Школнег еще и неадекватен в аське

Че с ним делать народ?

Тс, если еще возможно, брось тест в личку. И хотелось бы узнать, можно ли каким либо образом поучаствовать в проекте? Есть некоторые наработки в морфологии на php, если интересно глянь в подпись.

Похоже "ты последний" позлее стал, или мне кажется? (перекрестился)))

ыыы !! И срать будет некуда!!!

Всего: 117