Ну да, синтез текста по образцу с заменой каждого 10-го существительного на слово "кондиционер" и "вентиляция" :)
Типа "И тогда он, распаленный вентиляцией, расстегнув штаны, достал свой красный, налитый вентиляцией кондиционер. Она затрепетала при виде такого внушительного аппарата, тем более что это был первый кондиционер, который она видела! ..." :)
Я исповедую конечные автоматы :)
Ну вот я и пытаюсь выяснить размеры этого круга :)
Ну так пользуйся :)
http://linguist.nm.ru/stemka/stemka.html
Не, Димыч, не в деньгах дело :) Он сейчас выложен - уж пару лет как - бесплатно, в исходниках. Просто готовность заплатить что-то - пусть 1000 рэ - это некая мера нужности.
А если никому на хрен не надо - так что ж мне новую версию делать!
Так фишка как раз в том, что это стеммер, но стеммер, в отличие от "аналитических", т. е. от списков окончаний, "умный", и у него есть довольно большой словарь, которым он пользуется для выделения формальной основы.
Да, сделана на C. Выдает варианты усечения поданной словоформы, т. е. дает длину формально выделенной графической основы.
Дык, это ж речь уже о словарном идет! А я про вероятностный, про стемку, которая до сих пор в свободном download, и останется бесплатной и дальше!
Большое всем спасибо :) Мне было ОЧЕНЬ приятно! Честно!
При разработке программного комплекса, системы не "на день", использование STL вообще категорически противопоказано!
А если система еще и должна быть портируемой, то противопоказано вдвойне.
И причина в том, что STL, что бы ни говорили, катастрофически нестандартная штука, и разные версии его, например, 4 и 5, можно вообще считать абсолютно разными библиотеками.
Ну кинь мне приватно сайт и запрос.