релевантность документа

ЗодчийТеней
На сайте с 13.02.2006
Offline
11
1386

алгоритм расчета релевантности документа с морфологически измененным словом относительно документа с точным вхождением, кто-то знаком с вариантами решений? или есть предложения?

Я, однако, не скажу, что все иллюзии или бред нашего ума нужно называть сумасшествием. Эразм Роттердамский "Похвала глупости".
I
На сайте с 26.05.2001
Offline
64
#1
ЗодчийТеней:
алгоритм расчета релевантности документа с морфологически измененным словом относительно документа с точным вхождением, кто-то знаком с вариантами решений? или есть предложения?

см. яндексовое описание их системы. там все симпатично, ИМХО. единственное, что я бы поменял

1) Учитывал точные вхождения с чуточку большим весом, чем просто однокоренные слова. Как продолжение этой градации: грамматические формы учитывать с большим весом, чем однокоренные слова, то есть склеивать, скажем, деепричастия с глаголоами, но учитывать такую "склейку" с большим весом

2) Слова, находящиеся достаточно близко, должны безусловно всплывать наверх, но я не стал бы по умолчанию ограничивать поиск только таким вхождениями. Конечно, небольшая экономия от этого есть, но не очень существенная

3) Для баз разного размера естественного надо использовать разные значения "кворума". Например для интернет нестрогия соответствия для двухсловных запросов практически нонсенс, а для локальной базы с пару-десятков тысяч страниц вполне допустимая вещь

Приходите завтра, завтра будет! (http://itman666.livejournal.com)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий