оператор "like" и 12 слов

Тимон
На сайте с 08.06.2007
Offline
74
1120

Есть такой интересный оператор "like" - типа "искать похожие сайты". Если набрать в строке поиска #like="www.site.ru", то Яндекс покажет "похожие сайты".

Начал копать дальше, посмотрел reqtext...

Вот например,

#like="tarcom1ru.41.com1.ru"&reqtext=(тица::443553 && яндекс::42465 && показатель::17471 && цитирование::51142 && индекс::17165 && tar::76013 && обмен::6655 && алгоритм::56761 && владелец::13239 && повышение::19288 && автоматизировать::83384 && брокер::78673)//40&dsn=0&d=2988006&sh=1&sg=61&isu=1

Проверял другие сайты, везде оказывалось в reqtext 12 слов... По какому принципу они выбираются - пока не определил, есть подозрение, что по формуле TF*IDF, т.е. выбираются не просто самые редкие слова из документа, еще идет учет внутридокументной частоты (TF)

Возникла вопрос - неужели эти 12 слов служат только для поиска похожих документов?

Возможны следующие варианты:

1. По этим словам документы сравниваются на схожесть. Часть документов по дополнительным признакам отсеиваются из выдачи и появляются только при добавлении rd=0 (немного не согласуется с утверждением, что фильтрация в момент ответа на запрос зависит от самого запроса и соответственно от сниппетов. Пробовал 2 фразы: "Впервые сайты в русском сегменте сети Интернет были упорядочены по индексу цитирования 2 августа 1999 года" и укороченный вариант "Впервые сайты в русском сегменте сети" - во втором случае сайт tarcom1ru.41.com1.ru выпадает с первого места в небытие)

2. По этим словам Яндекс может определять тематику документа. Т.е. есть Яндекс каталог, каждому разделу которого сопоставлен некий набор слов. С каким набором пересечение более полное, значит такая и тема у страницы/сайта.

_____________________

Короче, есть ли у кого какие мнения по поводу этого всего?

«Я слышу - и забываю, я вижу - и помню, я чувствую - и понимаю» (с) Конфуций Теперь я занимаюсь продвижением сайтов здесь (http://www.i-vi.ru/) :) SEO фтоппку! Учим правила фотосъема! (http://www.fotonotes.ru/) - мои заметки о фото
Елистратов
На сайте с 21.04.2007
Offline
229
#1
Тимон:
Есть такой интересный оператор "like" - типа "искать похожие сайты". Если набрать в строке поиска #like="www.site.ru", то Яндекс покажет "похожие сайты".

Уточню...Похожие страницы;)

Тимон:

1. По этим словам документы сравниваются на схожесть.

Угу...Отсюда отталкивайтесь...

C уважением, Евгений. Покупаю аккаунты AdSense ()
Тимон
На сайте с 08.06.2007
Offline
74
#2

Ну да, "похожие страницы"

ОписАлся...

Лутчер
На сайте с 24.07.2007
Offline
36
#3

А почему именно 12 слов? И интересно, всё же эти 12 слов нужны для сравнения документов на схожесть или для определения тематики...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий