Функции нормирования и расчет IDF.

Yaroslav_Adv
На сайте с 27.09.2005
Offline
199
2096

Всем здравствуйте :)

Хотелось бы знать:

1. Есть ли информация о том, какие функции нормирования внутри-документной частоты используются в настоящее время поисковыми системами.

2. Есть ли информация о том, каким именно образом производится расчет частоты встречаемости термина (IDF) в определенной базе документов.

Скорее всего, ответов на эти вопросы я не получу, но вдруг?

Всем спасибо.

С уважением, Ярослав Деревягин Веб-агентство "Found (http://found-it.ru)"
wolf
На сайте с 13.03.2001
Offline
1183
#1

Незабвенный первоисточник

http://company.yandex.ru/articles/romip2004.xml

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
Yaroslav_Adv
На сайте с 27.09.2005
Offline
199
#2

wolf, если честно, конкретно про IDF там нет ничего, кроме его участия в формуле расчета веса слова по отношению к документу.

Насчет нормирования - протупил, согласен :)

MiRaj
На сайте с 03.07.2006
Offline
509
#3

Ярослав, смотрим начиная отсюда http://ru.wikipedia.org/wiki/TF-IDF

и продолжая http://www.miralab.ru/tools/service/#theory

и особенно http://ru.searchipedia.org/catalog/?text=IDF&go=go&sort=0&cb=

Муркетолог. 100 пресс-релизов с прямыми ссылками за 150 баксов? Легко! (http://b2blogger.com) Статейный маркетинг - лучшее лекарство от Минусинска! (http://miralinks.ru)
Yaroslav_Adv
На сайте с 27.09.2005
Offline
199
#4

MiRaj, вот где собака-то зарыта была. Я черт знает сколько страниц поиска перелопатил в поисках этой информации. У кого только не спрашивал. Спасибо! Респект.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий