Ну, это тоже понятно.
А мои цифры по размеру корпуса документов правдоподобны? Не хотел выкладывать соображения на основе недоделанной формулы, но раз спросили ...
wolf, моя предварительная оценка, что максимальный вес 20000000 в старом корпусе и равнялся кол-ву документов D. И это вовсе не потому, что IDF=D/DF=20000000/1 для 1-го найденного документа. Формула, понятно, совсем другая. Там используется тот самый Pontopic из РОМИП-2006, только в докладе дана упрощенная формула.
Если моя гипотеза окажется верной, то новый корпус вырос минимум в 4.5 раза - пока нашел вот такой вес 91352020.
У вас есть данные о размере корпуса анкор-файлов?
wilelf, не по любому
http://www.yandex.ru/yandsearch?text=%F2%F3%F0%E8%F1%F2%E8%F7%E5%F1%EA%E8%E5+%F1%E8%EC-%EA%E0%F0%F2%FB
Если слова запроса есть в title, нет в body (закрыто <noindex>), но есть в description, то последний будет снипетом.
Там такое дерево
<tr class="top"> @0.1.0.0
... меню ...
<noindex>
<tr> @0.1.0.2
<td class="left_column"> @0.1.0.2.0
... много текста ...
</td>
<td class="body"> @0.1.0.2.1
</noindex>
<tr> @0.1.0.3
Как вы думаете, что будет? Считайте, что выкинули всю строку <tr> @0.1.0.2 вместе с двумя ячейками, а это фактически весь текст. Проиндексируется только меню из <tr class="top">. Оно и ищется при поиске по главной.
Olegator555, не совпадает. Просто чукча - не писатель ;)
Olegator555, смотря для чего ;)
Доклады Яндекса на РОМИП и их приложение к ручкам не помешают.
Olegator555, а зачем тайное знание? Все в открытом доступе. Только anchor отменили, url по ссылке закрывают (или уже) ... кто следующий?
_S_, конечно, "иная" переколдовка уже не раз всплывала ;) Вот тут показал разницу для примера.
юни, при всем уважении ... нельзя переколдовку посмотреть, увы. Итеративно она подбирается, пока кто как может и знает. Но публичное распространение этих сведений - это санкции Яндекса на язык запросов :(
MiRaj обещает скоро запустить сервис. Только вот насколько это удачная идея ... не знаю.
attack, вы смотрите не в настоящем поиске, там ничего и не менялось.
Рискну предположить, что процесс еще не закончен. Те незначительные изменения в топе, которые прошли с сегодняшним псевдо-апом, не слишком соответствуют такой смене коллекции.
Если не ошибаюсь (поправьте), то предыдущая смена корпуса была в ап "счастливых билетов". Там еще и алгоритм крутили, но результаты все помнят - это не +-1 у отдельных наблюдадетей.
Надо чуток подождать. Могут ведь и откатиться, Яша любит эксперименты ;)