Жадный Яндекс

12 3
BM
На сайте с 15.06.2002
Offline
11
4842

Посмотрел в сегодняшний ночной лог вебсервера и ахнул: робот Яндека просто "взбесился". :eek:

За время с 05:45 до 07:07 был сделан 401 запрос к серверу. При том, что это приведены запросы к динамике.

Заметил, что с момента предыдущего запроса (который был в 01:13), изменился user agent: с Yandex/1.03.000 (compatible; Win16; M) на Yandex/1.01.001 (compatible; Win16; I). Раньше Яндекс ходил аккуратно и регулярно, сервер сильно не грузил. Этой ночью интервалы запросов были в среднем через 12 секунд, в пиках - через 1-2 секунды.

Это связано как-то с запуском сервиса Яндекс.Картинки или нашим сайтом просто решили "конкретно" заняться?

WBR, Andrey.
Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#1

bk_man

Ты что, смеешься? Это вполне нормальное поведение робота. Даже вполне умеренное. Этот сайт, к примеру, весь на динамике, за сутки отрабатывает около 4000 хитов. Придет Яндекс - будет отрабатывать на 10% больше. Или ты боишься, что у тебя сервер повесится? :)

UserAgent не менялся - это другой робот Яндекса.

Если подобное поведение робота грузит тебе сервер - ну, кроме совета дать по кривым рукам админу, мне больше в голову ничего не приходит. Нормально настроенный сервер вполне способен отработать 400 запрос к динамике за пару минут.

MA
На сайте с 02.07.2001
Offline
16
#2

нет... тут другое странно... 400 запросов за 1,5 часа... это очень неплохо!!! Особенно для Яндекса. Как бы яндекс не изменил обходчика, политику индексирования или аппаратную платформу.

Что касается различий в названиях роботов - то скорее всего это действительно разные агенты - один допустим проверяет страницы на живучесть, а другой забирает страницы.

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#3
скорее всего это действительно разные агенты

Это не скорее всего - это так и есть. Этим вопросом мы задавались очень давно. И давно же все выяснили

BM
На сайте с 15.06.2002
Offline
11
#4
Первоначальное сообщение от Gray
bk_man
Или ты боишься, что у тебя сервер повесится? :)
Нормально настроенный сервер вполне способен отработать 400 запрос к динамике за пару минут.

То, что сервер повесится, не боюсь (спасибо огромное Игорю Сысоеву за mod_accel), но задача робота - аккуратно индексировать сервер, а не пинать через пару секунд. Хотя наверное это моё ИМХО.

А вот прои динамику - вопрос интересный.

Действительно большого наплыва посетителей (коего ни мне, ни данному, простите, сайту не снилось) не выдерживает. Умеренная статика с удачно подобранным временем кэширования - так будет лучше. Опять же IMHO.

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#5
большого наплыва посетителей (коего ни мне, ни данному, простите, сайту не снилось) не выдерживает.

Хм... Значит, руки у админа все же кривые.

Этот, простите, сайт скромненько себе сидит на виртуал аккаунте за $10 в месяц и абсолютно не мешает своим 100 соседям по серверу.

По опыту могу сказать - нормально настроенный сервер, средней ценовой группы, не напрягаясь, держит штук 60 таких аккаунтов, на каждом из которых посещаемость составляет до 1000 посетителей в час. При чем каждый раз срабатывает mysql и так далее. Кстати, самым тяжелым процессом при этом оказывается httpd.

N
На сайте с 21.11.2001
Offline
152
#6
Первоначальное сообщение от Gray

Это не скорее всего - это так и есть. Этим вопросом мы задавались очень давно. И давно же все выяснили

Да, конечно. Но там нет такого товарища: Yandex/1.01.001+(compatible;+Win16;+P). Пережрал у меня все картинки, а их у меня более 15мб😮, причем только картинки. Может этот робот на картинках только и специализируется?

wolf
На сайте с 13.03.2001
Offline
1183
#7
Да, конечно. Но там нет такого товарища: Yandex/1.01.001+(compatible;+Win16;+P). Пережрал у меня все картинки, а их у меня более 15мб, причем только картинки. Может этот робот на картинках только и специализируется?

Дык недавно проект Яндекс-картинки запустили

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
N
На сайте с 21.11.2001
Offline
152
#8
Первоначальное сообщение от wolf


Дык недавно проект Яндекс-картинки запустили

Плавали, знаем ;). Я об этом, конечно, в первую очередь и подумал. Тем более, что P скорее всего означает Pictures. Интересный факт у меня еще получился - сервер IIS, при запросе robots.txt выдал этому роботу ответ 406. Только ему, остальным роботам нормально отвечал 200. 406 - source not acceptable (неприятный, не удовлетворительный), так да?

Что же именно случилось? Что не понравилось и кому?

User-Agent: *

Disallow: /css/

Disallow: /scripts/

Спасибо

Fad
На сайте с 25.09.2001
Offline
124
Fad
#9
Первоначальное сообщение от Nicon


Плавали, знаем ;). Я об этом, конечно, в первую очередь и подумал. Тем более, что P скорее всего означает Pictures. Интересный факт у меня еще получился - сервер IIS, при запросе robots.txt выдал этому роботу ответ 406. Только ему, остальным роботам нормально отвечал 200. 406 - source not acceptable (неприятный, не удовлетворительный), так да?
Что же именно случилось? Что не понравилось и кому?

User-Agent: *
Disallow: /css/
Disallow: /scripts/

Спасибо

406 означает, что ресурс не в том формате, который нужен клиенту.

С уважением, Фадеичев Андрей, руководитель проекта "Биржа контента eTXT.ru" (http://www.etxt.ru/)
N
На сайте с 21.11.2001
Offline
152
#10
Первоначальное сообщение от Fad


406 означает, что ресурс не в том формате, который нужен клиенту.

В смысле? А как же все остальные роботы, в том числе и Яндекса, получают в том формате?

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий