Вес слова

A
На сайте с 26.01.2005
Offline
1
484

Привет !

Ну все таки кто-нибудь может предложить алгоритм для определение веса слова относительно одного документа.

Например у меня есть два документа А и Б.

и в обоих встречается слово например пхп.

Как мне определить какой документ важнее при поиске на данное слово ?

Сейчас я делаю просто по кол-ву повторений. Т.е. Тот документ важнее в котором данное слово чаще встречается, но оказалось на практики токой подход не коректный. Как можно решить такую проблему ?

lagif
На сайте с 15.12.2004
Offline
30
#1

Обычно вес слов зависит от трех критериев

1. Принадлежность к тэгам (title, h1...h6, u, к примеру)

2. Частота слова в конкретном документе (т. е. количество этого слова :) )

3. Удаленность от начала документа...

Ну, и еще куча всяких заморочек

Это тоже пройдет...
greenwood
На сайте с 08.09.2003
Offline
519
#2

4.расстояние между ключевыми словами ( кстати на сегодня гугля к этому неравнодушна)

прогу найдешь у меня в подписи м..

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#3
расстояние между ключевыми словами

Это при запросах, состоящих из двух и более слов. Кстати, в этом случае это самый весомый фактор :).

AA
На сайте с 16.04.2001
Offline
70
#4

Для начала прочтите Сегаловича - обзор по большинству вопросов построения поисковой системы. Конкретно по Вашему вопросу попробуйте метод tf*idf.

С уважением, Антонов Александр.
greenwood
На сайте с 08.09.2003
Offline
519
#5

да ... а по однословным ( как бы это выразиться ) .... ИМХО не признаю как оптимизицию и никогда не берусь ..

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий