Словоформы и Яндекс

1 234
A
На сайте с 06.06.2006
Offline
115
#21

Позор мне. Теперь запомню раз и на всегда: асессор

Фриман
На сайте с 11.11.2005
Offline
50
#22

GRAYSTONE не та лемма:)

upyrj
На сайте с 17.09.2005
Offline
140
#23

GRAYSTONE, не та лемма. // дописал: Фриман, мысли сходятся. 8)

Лемма — если по-школьному, «словарная/начальная» форма слова. Для «ремонт», «ремонта» и «ремонтом» — лемма «ремонт».

Можно определить более корректно: лемма — это множество словоформ, различающихся только словоизменительными показателями:

лемма РЕМОНТ = {'ремонт', 'ремонта', 'ремонту'…}

лемма ИДТИ = {'иду', 'иди', 'шел'…}

Леммы, в отличие от словоформ, удобно хранить в словарях и поисковых индексах: входящие в лемму словоформы имеют, в некотором смысле, одно и то же значение. Не буду дальше вдаваться в теорию.

Тем не менее, не могу сказать, что я до конца понял сказанное Фриманом. 8)

Alias, ничего, бывает. 8)

Денис Иванов Важно: обменом валют я не занимаюсь.
GRAYSTONE
На сайте с 13.01.2006
Offline
74
#24

upyrj, спасибо за ликбез :)

:smoke:
Фриман
На сайте с 11.11.2005
Offline
50
#25

upyrj Ну грубо говоря если в один документ нахреначить 10 раз "ремонт окон", а в другой 5 раз "ремонт окон" а еще 5 вариаций, например "ремонту окон", "ремонтом окна" и т. д. то второй документ будет релевантнее первого по запросу "ремонт окон".

По-крайней мере я это наблюдал.

GRAYSTONE
На сайте с 13.01.2006
Offline
74
#26
Фриман:
upyrj Ну грубо говоря если в один документ нахреначить 10 раз "ремонт окон", а в другой 5 раз "ремонт окон" а еще 5 вариаций, например "ремонту окон", "ремонтом окна" и т. д. то второй документ будет релевантнее первого по запросу "ремонт окон".

В связи с этим назрел вопрос. Лемма определяется по общепринятым правилам или поисковая система сама определяет что является леммой для группы словоформ?

Фриман
На сайте с 11.11.2005
Offline
50
#27

GRAYSTONE А хрен знает что они там придумали:) Попробуйте поискать "морфологический анализ в Яндексе"

upyrj
На сайте с 17.09.2005
Offline
140
#28

Фриман, проще скачать mystem и посмотреть, что он реально со словоформами делает. 8)

Кажется, для слов из словаря — без изысков.

По поводу вашего наблюдения — может быть, но не думаю, что это хоть сколько-то заметно в конкурентных темах. 8/

_mihey
На сайте с 15.07.2005
Offline
199
#29

А вот такую загадочку можно ?

Мой сайт по "точному соответствию" находится по единственному числу запроса (пример = спелое яблоко) на первом месте. Также, по точному соответствию, во множественом числе (спелые яблоки) на втором. А при поиске без точного соответствия по любой из приведенных фраз - на четвертом. Не странно ли это ?

Наверное, говорит о том, что с "тошнением" переборщил ?

Куплю размещение статей с трансляцией в Я.Новости (/ru/forum/833079)
hypno
На сайте с 17.07.2006
Offline
110
#30

не забывайте что кроме яндекса есть и другие поисковики , например гугль :) которые более адекватно подбирают релевантные документы.

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий