поведение робота google

107

mnt

25 сентября 2003, 03:18

946

Робот заходит на страницу

25/09/2003 11:45

HTTP_USER_AGENT:Googlebot/2.1 (+http://www.googlebot.com/bot.html)

IF-MODIFIED-SINCE: Fri, 15 Aug 2003 03:41:35 GMT

/blabla.ru/zz.php?a=44&b=23

я ему отдаю

HTTP/1.0 304 Not Modified

тут же этот робот опять делает запрос к этой же странице

(но у же без IF-MODIFIED-SINCE)

25/09/2003 11:45

HTTP_USER_AGENT:Googlebot/2.1 (+http://www.googlebot.com/bot.html)

/blabla.ru/zz.php?a=44&b=23

и успешно её кушает

Так вот кто может объяснить, зачем он тут же второй раз забирает эту страницу если я ему человеским языком сказал HTTP/1.0 304 Not Modified

?

дорого куплю ссылки с хороших жирных русскоязычных авто сайтов.

[Удален]

25 сентября 2003, 08:58

#1

А если давать HTTP/1.1 304 Not Modified - не помогает ?

107

mnt

26 сентября 2003, 03:29

#2

Как писал Interitus
А если давать HTTP/1.1 304 Not Modified - не помогает ?

я забыл упомянуть, что для большинства документов if-modified-since обрабатывается гуглом корректно, а вот попадаются такие экзепляры пример которых я привет в своем первом топике.

C

120

Cherny

26 сентября 2003, 05:24

#3

А это делается для того, чтобы действительно проверить, менялся ли документ, или роботу голову морочат.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)

1183

wolf

26 сентября 2003, 06:04

#4

А это делается для того, чтобы действительно проверить, менялся ли документ, или роботу голову морочат.

Робот-шпион! :D Помню, ходили одно время легенды о таких. Из разряда оптимизаторских баек. Дескать, есть спецроботы для того, чтоб отлавливать клоакинг. Запускаются с секретных IP, представляются Мозиллой и сличают документы. Может, и этот из той же серии :)

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

C

120

Cherny

26 сентября 2003, 07:58

#5

Сергей, я думаю все не совсем так.

Скорее всего это не робот-шпион, да и вообще никакой не специальный робот, да и не в роботе дело, а в алгоритме построения списка ссылок на страницы для посещения роботом. Например, появилась внешняя ссылка на страницу, но страницу эту Гугл знает и в базе ее имеет, так вот и появляется в списке ссылок одна и та же страница, только первая ссылка с известной датой изменения документа, а вторая как бы новая. Позже он их склеивает.

Вот и получается такая карусель.

mnt, Вы проверьте, не мог ли Гугл найти новые ссылки именно на те страницы, которые он запрашивал дважды?

Все что нужно знать о DDоS-атаках грамотному менеджеру

Open AI тестирует память для ChatGPT