stemka - вероятностный морфологический анализатор.

K
На сайте с 27.11.2000
Offline
80
7934

У меня есть вопросы.

Ссылку умышленно не привожу - интересует мнение тех, кто уже пользуется.

1. Нужно ли дальнейшее усовершенствование stemk'и?

2. Нужно ли развить ее до полноценного вероятностного морфологического анализатора, который бы не только давал возможные усечения, но еще и оценивал вероятности того или иного усечения и определял часть речи и грамматические характеристики этого усечения?

3. Какие еще пожелания будут по реализации?

Если и на вопросы 1 и 2 ответы будут положительными, то будет и вопрос 4 :)

Согласны ли Вы заплатить, скажем, 1000 рублей за такой анализатор? Например, в качестве "чаевых" :)

С уважением, Андрей Коваленко aka Keva
lagif
На сайте с 15.12.2004
Offline
30
#1

Keva,

Я пользуюсь. До сих пор неплохо справляется (кроме, конечно, всем известных приколов и, конечно, слова "порно" :))

И неплохо бы развить.

Пока с частями речи я не особо церемонюсь, но неплохо бы делать качественный семантический разбор запросов (при этом, конечно, возникает необходимость юзерам вводить их грамотнее...)

Когда-то, когда все еще начиналось, мне очень понравился ваш анализатор. И до сих пор очень нравится :D

Я долго расхваливала прелести демо-версии начальству... Все согласно покивали, но платить не захотели. Сказали, когда поиск станет приносить доход...

Неотвратимый изъян анализатора - привязка к словарю. Над словарем требуется всегда много работы. Столько же, сколько, к примеру, над словарями Лингво или Мультилекса :) . И, конечно, стоимость соответственная выходит, ничего не поделаешь... :(

А так - очень похвальная и нужная работа.

Это тоже пройдет...
pro-maker
На сайте с 08.12.2003
Offline
281
#2

Решусь задать вопрос. :)

stemka отдает нулевые морфемы? Сделан на Си?

K
На сайте с 27.11.2000
Offline
80
#3
lagif:
Keva,
Я пользуюсь. До сих пор неплохо справляется (кроме, конечно, всем известных приколов и, конечно, слова "порно" :))
И неплохо бы развить.
...
Неотвратимый изъян анализатора - привязка к словарю. Над словарем требуется всегда много работы. Столько же, сколько, к примеру, над словарями Лингво или Мультилекса :) . И, конечно, стоимость соответственная выходит, ничего не поделаешь... :(
А так - очень похвальная и нужная работа.

Дык, это ж речь уже о словарном идет! А я про вероятностный, про стемку, которая до сих пор в свободном download, и останется бесплатной и дальше!

K
На сайте с 27.11.2000
Offline
80
#4
pro-maker:
Решусь задать вопрос. :)
stemka отдает нулевые морфемы? Сделан на Си?

Да, сделана на C. Выдает варианты усечения поданной словоформы, т. е. дает длину формально выделенной графической основы.

lagif
На сайте с 15.12.2004
Offline
30
#5

Keva, Я и про стемку говорила, и про анализатор - словарный, в смысле :)

А получится создать анализатор только на вероятностных методах и без словаря?

R
На сайте с 29.04.2003
Offline
37
#6

Извините что вмешиваюсь. К сожалению не знаком с Вашей программой, но по названию могу судить, что речь идет о стеминге. Не совсем тогда понятно, зачем нужен словарь?

K
На сайте с 11.11.2005
Offline
12
#7
Keva:
У меня есть вопросы.
Ссылку умышленно не привожу - интересует мнение тех, кто уже пользуется.
1. Нужно ли дальнейшее усовершенствование stemk'и?
2. Нужно ли развить ее до полноценного вероятностного морфологического анализатора, который бы не только давал возможные усечения, но еще и оценивал вероятности того или иного усечения и определял часть речи и грамматические характеристики этого усечения?
3. Какие еще пожелания будут по реализации?
Если и на вопросы 1 и 2 ответы будут положительными, то будет и вопрос 4 :)
Согласны ли Вы заплатить, скажем, 1000 рублей за такой анализатор? Например, в качестве "чаевых" :)

Не пользовался, но собираюсь посмотреть. На счет денег, скажу тебе, брат :) - 1000 не деньги, если мне понадобится твоя работа - без вопросов, куда подъехать знаешь, еще безалкогольно напоим :)

Если вы будете следовать инструкциям, то каждое блюдо будет получаться у вас таким же, как и у нас, даже если раньше вы никогда не занимались приготовлением пищи. Поваренная книга Мак-Колла и эпиграф Д. Кнута (http://www.turtle.ru/)
K
На сайте с 27.11.2000
Offline
80
#8
Rusl:
Извините что вмешиваюсь. К сожалению не знаком с Вашей программой, но по названию могу судить, что речь идет о стеминге. Не совсем тогда понятно, зачем нужен словарь?

Так фишка как раз в том, что это стеммер, но стеммер, в отличие от "аналитических", т. е. от списков окончаний, "умный", и у него есть довольно большой словарь, которым он пользуется для выделения формальной основы.

K
На сайте с 27.11.2000
Offline
80
#9
Kryukov:
Не пользовался, но собираюсь посмотреть. На счет денег, скажу тебе, брат :) - 1000 не деньги, если мне понадобится твоя работа - без вопросов, куда подъехать знаешь, еще безалкогольно напоим :)

Не, Димыч, не в деньгах дело :) Он сейчас выложен - уж пару лет как - бесплатно, в исходниках. Просто готовность заплатить что-то - пусть 1000 рэ - это некая мера нужности.

А если никому на хрен не надо - так что ж мне новую версию делать!

K
На сайте с 11.11.2005
Offline
12
#10
Keva:
Просто готовность заплатить что-то - пусть 1000 рэ - это некая мера нужности.
А если никому на хрен не надо - так что ж мне новую версию делать!

НЕ хотел тебя расстраивать, но, сам понимаешь, такая вешь может быть необходима достаточно ограниченному кругу. При сносной реализации мне точно может пригодиться. Сколько нас таких - бог его знает :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий