cymax

cymax
Рейтинг
16
Регистрация
28.08.2007
Нет. Там, кстати, другой способ вычисления обратной частоты.

Ну, это тоже понятно.

А мои цифры по размеру корпуса документов правдоподобны? Не хотел выкладывать соображения на основе недоделанной формулы, но раз спросили ...

wolf, моя предварительная оценка, что максимальный вес 20000000 в старом корпусе и равнялся кол-ву документов D. И это вовсе не потому, что IDF=D/DF=20000000/1 для 1-го найденного документа. Формула, понятно, совсем другая. Там используется тот самый Pontopic из РОМИП-2006, только в докладе дана упрощенная формула.

Если моя гипотеза окажется верной, то новый корпус вырос минимум в 4.5 раза - пока нашел вот такой вес 91352020.

У вас есть данные о размере корпуса анкор-файлов?

wilelf:
Причем, по любому запросу, по которому можно найти сайт, нет сниппета...

wilelf, не по любому

http://www.yandex.ru/yandsearch?text=%F2%F3%F0%E8%F1%F2%E8%F7%E5%F1%EA%E8%E5+%F1%E8%EC-%EA%E0%F0%F2%FB

Если слова запроса есть в title, нет в body (закрыто <noindex>), но есть в description, то последний будет снипетом.

Там такое дерево

<tr class="top"> @0.1.0.0

... меню ...

<noindex>

<tr> @0.1.0.2

<td class="left_column"> @0.1.0.2.0

... много текста ...

</td>

<td class="body"> @0.1.0.2.1

</noindex>

... много текста ...

</td>

<tr> @0.1.0.3

Как вы думаете, что будет? Считайте, что выкинули всю строку <tr> @0.1.0.2 вместе с двумя ячейками, а это фактически весь текст. Проиндексируется только меню из <tr class="top">. Оно и ищется при поиске по главной.

Olegator555, не совпадает. Просто чукча - не писатель ;)

Olegator555, смотря для чего ;)

Доклады Яндекса на РОМИП и их приложение к ручкам не помешают.

Olegator555, а зачем тайное знание? Все в открытом доступе. Только anchor отменили, url по ссылке закрывают (или уже) ... кто следующий?

_S_, конечно, "иная" переколдовка уже не раз всплывала ;) Вот тут показал разницу для примера.

юни, при всем уважении ... нельзя переколдовку посмотреть, увы. Итеративно она подбирается, пока кто как может и знает. Но публичное распространение этих сведений - это санкции Яндекса на язык запросов :(

MiRaj обещает скоро запустить сервис. Только вот насколько это удачная идея ... не знаю.

attack, вы смотрите не в настоящем поиске, там ничего и не менялось.

Рискну предположить, что процесс еще не закончен. Те незначительные изменения в топе, которые прошли с сегодняшним псевдо-апом, не слишком соответствуют такой смене коллекции.

Если не ошибаюсь (поправьте), то предыдущая смена корпуса была в ап "счастливых билетов". Там еще и алгоритм крутили, но результаты все помнят - это не +-1 у отдельных наблюдадетей.

Надо чуток подождать. Могут ведь и откатиться, Яша любит эксперименты ;)

Всего: 123