Вес слова

A

1

anarchy

24 февраля 2005, 09:28

508

Привет !

Ну все таки кто-нибудь может предложить алгоритм для определение веса слова относительно одного документа.

Например у меня есть два документа А и Б.

и в обоих встречается слово например пхп.

Как мне определить какой документ важнее при поиске на данное слово ?

Сейчас я делаю просто по кол-ву повторений. Т.е. Тот документ важнее в котором данное слово чаще встречается, но оказалось на практики токой подход не коректный. Как можно решить такую проблему ?

30

lagif

24 февраля 2005, 09:40

#1

Обычно вес слов зависит от трех критериев

1. Принадлежность к тэгам (title, h1...h6, u, к примеру)

2. Частота слова в конкретном документе (т. е. количество этого слова :) )

3. Удаленность от начала документа...

Ну, и еще куча всяких заморочек

Это тоже пройдет...

Одинаковые Title и H1 Влияние название сайта в Как правильно сделать title

519

greenwood

24 февраля 2005, 09:50

#2

4.расстояние между ключевыми словами ( кстати на сегодня гугля к этому неравнодушна)

прогу найдешь у меня в подписи м..

482

Sergey Petrenko

24 февраля 2005, 09:52

#3

расстояние между ключевыми словами

Это при запросах, состоящих из двух и более слов. Кстати, в этом случае это самый весомый фактор :).

AA

70

AlexA

24 февраля 2005, 09:55

#4

Для начала прочтите Сегаловича - обзор по большинству вопросов построения поисковой системы. Конкретно по Вашему вопросу попробуйте метод tf*idf.

С уважением, Антонов Александр.

519

greenwood

24 февраля 2005, 09:57

#5

да ... а по однословным ( как бы это выразиться ) .... ИМХО не признаю как оптимизицию и никогда не берусь ..

Open AI тестирует память для ChatGPT

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ