Странное поведение робота

zoblin
На сайте с 16.07.2007
Offline
104
542

Никак не могу понять, как все-таки страницы в индекс попадают. Ситуация такая: в разделе для вебмастеров в Яндексе четко обозначена дата посещения сайта роботом - 12 февраля. Ввожу запрос в Яндексе с названием своего сайта и вижу, что в кэше сохранена копия сайта со статьями вплоть до 11 февраля.

Далее - ввожу запрос с названием одного из своих материалов, опубликованных 25 февраля. Яндекс сразу выдает мой сайт. Смотрю сохраненную копию моего сайта - там все статьи с моего сайта вплоть до 26 февраля.

Как так получается? Ну я ещё могу понять, что Яндекс бы нашел мою статью не заходя на мой сайт роботом через всякие сайты, транслирующие RSS (ну типа RedTram), но Яндекс же в итоге сделал копию моего сайта, а значит заходил на него роботом??

И как тогда выходит, есть несколько копий моего сайта по разным датам что-ли в Яндексе?

bojo
На сайте с 25.02.2008
Offline
72
#1

Почему дата последнего посещения отличается от того, что я вижу в логах своего http сервера?

Информация о сайтах обновляется в течение нескольких дней.

Взято из faq на странице webmaser.yandex.ru

Что подразумевает яндекс под фразой 'нескольких дней' можно только догадыватся )) Скорее всего он пишет дату последнего апа.

Елистратов
На сайте с 21.04.2007
Offline
229
#2

1. В яндекс вебмастере не всегда правильная дата последнего обращения робота к сайту.

2. К тому же информация меняется после апдейтов, а их не было с 15 числа.

3. Страницы попадают в базу яндекса не только во время апдейтов. У яндекса база данных делиться на две. Первая основная, а вторая быстророботская. Так вот те страницы которые появились в яндексе уже после апдейта являются быстророботскими и ранжирование таких страниц идет по своеобразному алгоритму, а во время апдейта эти быстророботские странички попадают в основную базу и т.д.

C уважением, Евгений. Покупаю аккаунты AdSense ()

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий