Форум Практика оптимизации Поисковые технологии

релевантность документа

23 марта 2006, 12:57

1386

алгоритм расчета релевантности документа с морфологически измененным словом относительно документа с точным вхождением, кто-то знаком с вариантами решений? или есть предложения?

Я, однако, не скажу, что все иллюзии или бред нашего ума нужно называть сумасшествием. Эразм Роттердамский "Похвала глупости".

itman

23 марта 2006, 18:57

ЗодчийТеней:
алгоритм расчета релевантности документа с морфологически измененным словом относительно документа с точным вхождением, кто-то знаком с вариантами решений? или есть предложения?

см. яндексовое описание их системы. там все симпатично, ИМХО. единственное, что я бы поменял

1) Учитывал точные вхождения с чуточку большим весом, чем просто однокоренные слова. Как продолжение этой градации: грамматические формы учитывать с большим весом, чем однокоренные слова, то есть склеивать, скажем, деепричастия с глаголоами, но учитывать такую "склейку" с большим весом

2) Слова, находящиеся достаточно близко, должны безусловно всплывать наверх, но я не стал бы по умолчанию ограничивать поиск только таким вхождениями. Конечно, небольшая экономия от этого есть, но не очень существенная

3) Для баз разного размера естественного надо использовать разные значения "кворума". Например для интернет нестрогия соответствия для двухсловных запросов практически нонсенс, а для локальной базы с пару-десятков тысяч страниц вполне допустимая вещь

Приходите завтра, завтра будет! (http://itman666.livejournal.com)

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

В 2023 году Одноклассники пресекли более 9 млн подозрительных входов в учетные записи

релевантность документа