Как привести слова к нормальной форме?

12
B
На сайте с 02.09.2002
Offline
42
bvd
#11
Как писал skv
Мы обращались за помощью к ruscorpora.ru, но понимания не встретили.

А нельзя ли по-подробнее?

Я, все-таки, полагаю, что с ruscorpora.ru вполне можно договориться. Либо Вы сообщаете здесь не все детали...

S
На сайте с 15.06.2005
Offline
0
skv
#12
Как писал bvd

Либо Вы сообщаете здесь не все детали...

Как я уже сказал, используемый метод морфологического анализа будет опубликован подробно на конференции RCDL, о которой многие участники данного форма знают не по наслышке.

В рамках данной задачи сами тексты нам не нужны, нам нужны только словоформы. Получить доступ к размеченному корпусу было бы тоже неплохо для наших дальнейших разработок, несвязанных с морфологическим анализом, но сейчас это необязательно. У нас есть своя база, характеристики которой я приводил ранее, но в исследовательских целях было бы интересно опробовать наши методы на чем-нибудь другом. Еще раз повторюсь нам подойдет любой текстовый массив сопоставимый по объему с нашим, а желательно, чтобы он его превосходил. Все у кого есть возможность нам помочь, просьба откликнуться.

B
На сайте с 02.09.2002
Offline
42
bvd
#13
skv:

В рамках данной задачи сами тексты нам не нужны, нам нужны только словоформы. Получить доступ к размеченному корпусу было бы тоже неплохо для наших дальнейших разработок, несвязанных с морфологическим анализом, но сейчас это необязательно.

Так я не понял, при чем здесь был ruscorpora? (Это наезд? :) )

Почему оттуда нельзя получить такие списки?

Можно также обратиться в Яндекс. Такие списки доступны в рамках программы стипендий.

B
На сайте с 02.09.2002
Offline
42
bvd
#14

Если же интересуют тексты для некоммерческих целей - попробуйте обратиться за ними в РОМИП.

Там будет и легче сравниться - можно, наверное, отдельную дорожку организовать.

S
На сайте с 15.06.2005
Offline
0
skv
#15
bvd:
Если же интересуют тексты для некоммерческих целей ...

Интересуют именно тексты для некоммерческих целей. Покупать корпусы для исследований, которые в дальнейшем будут опубликованы - занятие неблагодарное.

К яндексу обратиться попробуем. На счет РОМИПа думали, но пока решили не участвовать.

bvd:
Почему оттуда нельзя получить такие списки?

Такие списки можно получить из многих источников, если ruscorpora согласится нами их дать, мы будем только рады. Но пока положительного ответа мы не получили. Вообще для этого и было опубликовано сообщение на данном форуме.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий