Определение яндексом тематики сайта

ИМХО
На сайте с 05.01.2008
Offline
42
723

Какую еще информацию кроме как из ЯКа и от модераторов Я.директа он может использовать?

Подскажите пожалуйста. Как-то не задавался раньше этим вопросом.

С уважением, Константин.
Z
На сайте с 23.05.2007
Offline
69
#1
ИМХО:
Определение яндексом тематики сайта

Здесь наверное стоит уточнить, что помимо тематики сайта, Яндекс похоже умеет автоматом определять тематику и отдельного документа (по анализу его содержимого), ставя ему в соответствие один из разделов Яндекс Каталога.

Можно, например, заглянуть в первоисточник - доклад на РОМИП-2006. Там есть один достаточно интересный раздел "2.4 Pseudo-relevance feedback". ;)

ИМХО
На сайте с 05.01.2008
Offline
42
#2

Ziby, спасибо, сейчас почитаем.

ИМХО добавил 13.04.2008 в 10:39

В двух словах "тащите тексты из ЯКа и из топа, будете релевантны" :D

Искренне надеюсь, что Яндекс за 2 года придумал что-то другое.

Однако меня интересовал более прозаичный вопрос. Как яндекс определяет тематику для расчета тИЦ сайта не находящегося в ЯКе или директе?

Z
На сайте с 23.05.2007
Offline
69
#3

ИМХО, а вот надо было читать, не акцентируя внимание на релевантности. ;)

Как яндекс определяет тематику для расчета тИЦ сайта не находящегося в ЯКе или директе?

Анализирует содержимое документа и ставит ему в соответствие один из разделов Яндекс Каталога (писал же выше). Также как когда мы вводим в директе ключевое слово (слова), нам предлагается размещение в определённой рубрике Яндекс Каталога.

Как он анализирует содержимое документа - это уже другой вопрос. Возможно он как-то пляшет от частоты встречаемости слова (слов) в документе, а также веса этого слова (слов) в общей коллекции документов.

ИМХО
На сайте с 05.01.2008
Offline
42
#4
Ziby:
ИМХО, а вот надо было читать, не акцентируя внимание на релевантности. ;)

Ziby, привычка ))

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий