Бешеный бот Mail.ru

12 3
K
На сайте с 12.07.2006
Offline
295
Kpd
5030

На одном сайте использую Яндекс.xml для поиска по сайту, лимита 1000 запросов в сутки хватает с головой. Недавно посетители начали жаловаться, что поиск сломался. Стал проверять и обнаружил, что бот Mail.Ru/1.0 с дикой скоростью дергает одну и ту же страницу с поисковым запросом (yandex.php?query=запрос). Проверил IP бота - действительно mail.ru-шные.

Для наглядности статистика (дата - количество заходов бота на страницу поиска).

2010-01-22 11

2010-01-23 438

2010-01-26 392

2010-02-06 1153

2010-02-07 2780

2010-02-09 1566

2010-02-11 8452

2010-02-12 14

2010-02-19 4220

2010-03-09 5402

2010-03-11 1706

2010-03-12 7211

Это нормально или как?

З.Ы. Добавил страницу в robots.txt, сегодня бот не появлялся.

Mahrock
На сайте с 28.04.2006
Offline
193
#1

У меня меиловский бот регулярно опускал сервак в даун, пока не запретил ему доступ нафиг

CM
На сайте с 24.03.2009
Offline
136
#2
Mahrock:
У меня меиловский бот регулярно опускал сервак в даун, пока не запретил ему доступ нафиг

Сам заметил неделю назад, что активность его стала чрезмерной, решил не банить его пока, но мысли такие были в голове.

Как Вы его забанили через диапазон ip, через ipfw?

Alipapa
На сайте с 01.02.2008
Offline
194
#3

а crawl-delay на него не действует?

Биржа фриланса - простая и удобная (http://kwork.ru/ref/2541)
ternet.ru
На сайте с 12.09.2007
Offline
140
#4
Alipapa:
а crawl-delay на него не действует?

Действует.

W7
На сайте с 04.11.2009
Offline
6
#5

Улыбнуло название темы - "Бешеный бот Mail.ru")))

а задержки действительно должны работать

Свежие базы Яндекс Каталога (http://www.yacabase.ru)
agentvini
На сайте с 27.06.2008
Offline
40
#6

ну как мне кажется полностью банить бота это крайние меры. в случае с ТС, я бы порекомендовал действительно закрыть от него те страницы, по которым он делает максимальное неудобство. то есть тот же Яндекс.xml, либо если при индексации изображений идет большая нагрузка на серв

Тематический обмен (/ru/forum/319815) ссылками и статьями на темы туризм, отдых, гостиницы, рестораны с сайтом ЯК, тИЦ 300, Дмоз, ПР 3
F
На сайте с 18.03.2010
Offline
1
#7

У меня вроде на парочке сдл не наблюдалось такой "бешенной" активности)

F
На сайте с 12.03.2007
Offline
85
#8

Бот mail.ru не следует robots.txt. Приходится его банить.

Как начать тренироваться (http://max-body.ru/quick_start.html), Бодибилдинг форум (http://fatal-energy.com/). Обменяюсь/куплю ссылками со статей (или статьями) с сайтами бодибилдинг/фитнес тематики.
F
На сайте с 04.07.2008
Offline
75
#9

Так-так-так,

вот оно что... а подробнее для не особо одаренных.

Если crawl-delay на него действует то подскажите как правильно прописать.

Vilmas
На сайте с 19.12.2008
Offline
47
#10

Они еще тестируют свой поиск, поэтому и такие косяки. /ru/forum/comment/6556287

Создание и поддержка форумов (Postrk.com) (http://postrk.com/): дизайн, настройка, оптимизация. А так же наполнение сообщениями (постинг) и т.д. Тема с отзывами на серче (/ru/forum/642921).
12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий