Садовский

Рейтинг
52
Регистрация
27.10.2003

Большое спасибо всем за поздравления и пожелания! Будем стараться. :)

С уважением,

Александр Садовский.

alexseo:
Поиск "только на украинских сайтах" очень сырой. Много мусора, некоторые сайты исчезают из выдачи. Как определяется, что сайт украинский? Регион Украина в каталоге, язык, домен, хостинг?

Сейчас это три группы документов (и, соответственно, сайтов):

  • документы с сайтов в домене ua;
  • документы с сайтов, которые в Каталоге Яндекса относятся к Украине;
  • документы на украинском языке.

Полнота и точность определения региона сайта будут улучшаться.

С уважением,

Александр Садовский.

dweller:
Александр, нечеткие дубликты всегда удаляются или могут просто писсемизироваться?

Для нечетких дубликатов (если они распознаны) всегда действует четкая логика: в поиске находится либо один, либо другой.

Александр Садовский.

wolf:
Рассказал бы лучше про пару-тройку свежих фильтров, а то народ волнуется - "пессимизируют", дескать, жестоко. :D

По просьбам трудящихся -- читайте корпоративный блог Яндекса.

Александр Садовский.

Seventh Son:
Ну а какие действительно интересные темы есть сейчас, чтобы они начали себя проявлять? Про всякие вылеты морд/сайтов - ну это они комментировать не будут - это их внутрениие секреты, аналогчно апдейты и т.п.

Почему же. :) На разумные вопросы ответ всегда найдется.

Могу раскрыть страшную тайну, почему отличались результаты поиска при разных numdoc (или параметре "число ссылок на странице" при использовании расширенного поиска), и почему они сейчас одинаковые. Для результатов с разным количеством ссылок на страницу использовались различные кеши, а теперь кеш единый.

Вылеты морд в большинстве случаев связаны с ошибкой веб-мастера -- например, в нескольких случаях из-за неправильной настройки сервера робот получал код 400 вместо 200-го. Одна ошибка была на нашей стороне (не всегда правильно определялся главный дубликат страницы), ее мы исправили. Поэтому выпадение морд является ненормальной ситуацией, и если она встретится, присылайте URL сайта -- это поможет понять, в чем проблема и, возможно, найти ошибку. Я не обещаю отвечать на такие письма, но все обязательно будут рассмотрены.

Еще один миф -- изменение числа документов, написанное внизу главной страницы Яндекса. Уменьшение этого числа на 10-20% не связано ни с потерей кластеров, ни с расстрелом дорвеев, а вызвано удалением нечетких дубликатов страниц.

Александр Садовский.

NULL:
А по поводу С - Дятла может кто-нибудь что-нибудь сказать? Его в новых FAQ еще нет.

Уже есть, дятел как дятел. :)

http://webmaster.yandex.ru/faq.xml?id=502499#user-agent

Александр Садовский.

darik:
213.180.198.130|Yandex/2.01.000 (compatible; Win16; Dyatel; C)?? Кто нибудь знает что это за робот такой???

Это "простукивалка" каталога. Все Дятлы были посчитаны, измерены и описаны здесь:

http://webmaster.yandex.ru/faq.xml?id=502499#user-agent

Александр Садовский.

Огромное спасибо всем за пожелания и теплые поздравления!

С уважением,

Александр Садовский.

Junior:
Нажимаем ссылочку "Еще с сайта (200)"
Яка: "Результат поиска: страниц — 142"

Яндекс убирает нечеткие дубликаты не только при индексации, но и во время выполнения запроса. Если два документа очень похожи в частях, соответствующих запросу, они считаются дубликатами по данному запросу. Удаление дублей делается постепенно, по мере листания, чтобы как можно быстрее отдать пользователю результаты. Именно с этим связано пресловутое "уменьшение" количества найденных страниц.

В случае запросов вроде url="...", контекстом считается описание документа в title + meta description. Многие сайты имеют одинаковые описания для всех документов, в таком случае печатаемое количество найденных страниц резко уменьшается при листании.

С уважением,

Александр Садовский.

Как писал Dimaman
iseg, Садовский, скажите, а намерен ли Яндекс удалить форумы и блоги из выдачи основного поиска, после того как поиск по блогам заработет не как beta?

Основной поиск Яндекса продолжит индексировать блоги и форумы. Просто наш новый поиск пока умеет делать это умнее и быстрее. Мы постараемся со временем научить большой поиск обходиться с блогами и форумами столь же умело, как это делает его младший брат.

С уважением,

Александр Садовский.

Всего: 195