Keva

Рейтинг
80
Регистрация
27.11.2000
Интересы
Software development, linguistics, BMW, dogs, girls ;-)
greenwood:
Надо его к дорвеям привязать ..тогда и финансирование пойдет на благо науки :)

Ну да, синтез текста по образцу с заменой каждого 10-го существительного на слово "кондиционер" и "вентиляция" :)

Типа "И тогда он, распаленный вентиляцией, расстегнув штаны, достал свой красный, налитый вентиляцией кондиционер. Она затрепетала при виде такого внушительного аппарата, тем более что это был первый кондиционер, который она видела! ..." :)

lagif:
А никто не пробовал для стемминга использовать обученную нейросеть? :d

Я исповедую конечные автоматы :)

Kryukov:
НЕ хотел тебя расстраивать, но, сам понимаешь, такая вешь может быть необходима достаточно ограниченному кругу.
...
Сколько нас таких - бог его знает :)

Ну вот я и пытаюсь выяснить размеры этого круга :)

Kryukov:
При сносной реализации мне точно может пригодиться.

Ну так пользуйся :)

http://linguist.nm.ru/stemka/stemka.html

Kryukov:
Не пользовался, но собираюсь посмотреть. На счет денег, скажу тебе, брат :) - 1000 не деньги, если мне понадобится твоя работа - без вопросов, куда подъехать знаешь, еще безалкогольно напоим :)

Не, Димыч, не в деньгах дело :) Он сейчас выложен - уж пару лет как - бесплатно, в исходниках. Просто готовность заплатить что-то - пусть 1000 рэ - это некая мера нужности.

А если никому на хрен не надо - так что ж мне новую версию делать!

Rusl:
Извините что вмешиваюсь. К сожалению не знаком с Вашей программой, но по названию могу судить, что речь идет о стеминге. Не совсем тогда понятно, зачем нужен словарь?

Так фишка как раз в том, что это стеммер, но стеммер, в отличие от "аналитических", т. е. от списков окончаний, "умный", и у него есть довольно большой словарь, которым он пользуется для выделения формальной основы.

pro-maker:
Решусь задать вопрос. :)
stemka отдает нулевые морфемы? Сделан на Си?

Да, сделана на C. Выдает варианты усечения поданной словоформы, т. е. дает длину формально выделенной графической основы.

lagif:
Keva,
Я пользуюсь. До сих пор неплохо справляется (кроме, конечно, всем известных приколов и, конечно, слова "порно" :))
И неплохо бы развить.
...
Неотвратимый изъян анализатора - привязка к словарю. Над словарем требуется всегда много работы. Столько же, сколько, к примеру, над словарями Лингво или Мультилекса :) . И, конечно, стоимость соответственная выходит, ничего не поделаешь... :(
А так - очень похвальная и нужная работа.

Дык, это ж речь уже о словарном идет! А я про вероятностный, про стемку, которая до сих пор в свободном download, и останется бесплатной и дальше!

Большое всем спасибо :) Мне было ОЧЕНЬ приятно! Честно!

itman:
Господа, STLая сортировка очень даже неплоха.

При разработке программного комплекса, системы не "на день", использование STL вообще категорически противопоказано!

А если система еще и должна быть портируемой, то противопоказано вдвойне.

И причина в том, что STL, что бы ни говорили, катастрофически нестандартная штука, и разные версии его, например, 4 и 5, можно вообще считать абсолютно разными библиотеками.

aur:
Добрый вечер.
Сайт существует более полугода. В яндексе, гугле все более менее, в рамблере - слёзы. Нет и в 300-ке
Как вычислить больные и нелюбимые рамблером "места"? :)

Ну кинь мне приватно сайт и запрос.

Всего: 238