Робот mail.ru грузит хостинг. Как запретить?

12
A
На сайте с 03.04.2010
Offline
179
4877

Как запретить эту гадость в роботсе? Каждый день проходится по моим сайтам и накрывает весь хостинг. Вот айпи 217.69.134.174, и еще много из 217.69.134.*

gormarket
На сайте с 29.12.2010
Offline
47
#1

мне встречался еще адрес 217.69.133.??

Посмотрите одну из старых тем, там о роботе Яндекса, но может что заинтересует...

попробуйте добавить в файл .htaccess

RewriteCond %{HTTP_USER_AGENT} ^Mail.Ru/1.0$
RewriteRule .* - [G]

флаг G делает текущий URL «мертвым», т.е. немедленно отправляется HTTP ответ со статусом 410 (GONE)

Товары и цены в магазинах Вашего города: Городской рынок (http://gormarket.ru/)
H1
На сайте с 07.11.2007
Offline
60
#2

Сайты коммерческие, или ГС?

Если первое - то разумнее сменить тариф или хостинг. Зачем терять потенциальных посетителей с мейла?

A
На сайте с 03.04.2010
Offline
179
#3

гсы, вот почему и хочу снизить нагрузку на хост

gormarket, спасибо попробую, а бот точно так называется?

askary добавил 31.12.2010 в 00:40

askary добавил 31.12.2010 в 00:48

gormarket
На сайте с 29.12.2010
Offline
47
#4
askary:
а бот точно так называется?

Именно так и представляется (с приведеных IP-адресов, в логах смотрел). Сканирует сразу тысячи адресов, и пропадает...

Если есть возможность, уточните у себя в лог-файлах.

A
На сайте с 03.04.2010
Offline
179
#5

у меня логи временно не пишутся. Ладно, спасибо, попробую Ваш совет

gormarket
На сайте с 29.12.2010
Offline
47
#6

То, что я предложил добавить в файл .htaccess, будет блокировать доступ роботу, но запросы от него на сайт будут продолжаться (по крайней мере первое время).

Но можно попробовать "по-хорошему" сообщить ему, чтобы он не индексировал сайт (в файле robots.txt).

User-agent: Mail.Ru
Disallow: / # блокирует доступ ко всему сайту

(это цитата из "Robots.txt для контроля работы поискового робота Mail.Ru")

А если не поможет, то сработает блокировка в .htaccess

K
На сайте с 31.01.2001
Offline
737
#7
gormarket:
попробуйте добавить в файл .htaccess

RewriteCond %{HTTP_USER_AGENT} ^Mail.Ru/1.0$
RewriteRule .* - [G]

А это позволит роботу скачать файл /robots.txt , чтобы увидеть запрет?

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
DV
На сайте с 01.05.2010
Offline
644
#8
VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )
A
На сайте с 03.04.2010
Offline
179
#9

бот сначала смотрит на роботс или htaccess?

M1
На сайте с 13.02.2007
Offline
165
#10
askary:
бот сначала смотрит на роботс или htaccess?

На .htaccess бот смотреть не может в принципе, это настройки сервера. При обходе боты обычно первым делом обращаются к robots.txt, а затем начинают обход страниц, но если забанить бота в .htaccess то он не сможет обратиться даже к robots.txt

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий