Большое спасибо всем за поздравления и пожелания! Будем стараться. :)
С уважением,
Александр Садовский.
Сейчас это три группы документов (и, соответственно, сайтов):
Полнота и точность определения региона сайта будут улучшаться.
Для нечетких дубликатов (если они распознаны) всегда действует четкая логика: в поиске находится либо один, либо другой.
По просьбам трудящихся -- читайте корпоративный блог Яндекса.
Почему же. :) На разумные вопросы ответ всегда найдется.
Могу раскрыть страшную тайну, почему отличались результаты поиска при разных numdoc (или параметре "число ссылок на странице" при использовании расширенного поиска), и почему они сейчас одинаковые. Для результатов с разным количеством ссылок на страницу использовались различные кеши, а теперь кеш единый.
Вылеты морд в большинстве случаев связаны с ошибкой веб-мастера -- например, в нескольких случаях из-за неправильной настройки сервера робот получал код 400 вместо 200-го. Одна ошибка была на нашей стороне (не всегда правильно определялся главный дубликат страницы), ее мы исправили. Поэтому выпадение морд является ненормальной ситуацией, и если она встретится, присылайте URL сайта -- это поможет понять, в чем проблема и, возможно, найти ошибку. Я не обещаю отвечать на такие письма, но все обязательно будут рассмотрены.
Еще один миф -- изменение числа документов, написанное внизу главной страницы Яндекса. Уменьшение этого числа на 10-20% не связано ни с потерей кластеров, ни с расстрелом дорвеев, а вызвано удалением нечетких дубликатов страниц.
Уже есть, дятел как дятел. :)
http://webmaster.yandex.ru/faq.xml?id=502499#user-agent
Это "простукивалка" каталога. Все Дятлы были посчитаны, измерены и описаны здесь:
Огромное спасибо всем за пожелания и теплые поздравления!
Яндекс убирает нечеткие дубликаты не только при индексации, но и во время выполнения запроса. Если два документа очень похожи в частях, соответствующих запросу, они считаются дубликатами по данному запросу. Удаление дублей делается постепенно, по мере листания, чтобы как можно быстрее отдать пользователю результаты. Именно с этим связано пресловутое "уменьшение" количества найденных страниц.
В случае запросов вроде url="...", контекстом считается описание документа в title + meta description. Многие сайты имеют одинаковые описания для всех документов, в таком случае печатаемое количество найденных страниц резко уменьшается при листании.
Основной поиск Яндекса продолжит индексировать блоги и форумы. Просто наш новый поиск пока умеет делать это умнее и быстрее. Мы постараемся со временем научить большой поиск обходиться с блогами и форумами столь же умело, как это делает его младший брат.