Проконсультируйте, боты

12
M5
На сайте с 28.12.2005
Offline
135
772

Здравствуйте уважаемые коллеги.

Прошу Вашей консультации в таком вопросе. Буквально сегодня на одном моем ресурсе был превышен лимит трафика. Об этом пришло уведомление от хостера и собственно я обратился к нему с вопросом в чем причина. Как выяснилось дело вроде бы кроется в парсинге ботами(в частности подсеть: 81.19.64.0 - 81.19.66.255) Рамблера или как мне объяснили может быть кто-то игрался как-то через эти ИПы...

Вопрос у меня один, какие способы решения есть этой проблемы? Сейчас закрыл через .htaccess всю подгруппу, но может есть какой-то более гуманный подход?

Спасибо.

Деймос
На сайте с 10.09.2008
Offline
138
#1

Используйте robots.txt Пример:

User-agent: * (тут вместо звездочки можете указать своего бота в вашем случаи рамблера)

Crawl-delay: 2

tommy-gung
На сайте с 22.11.2006
Offline
287
#2
Michael-5:
Проконсультируйте, боты

замечательное обращение

Michael-5:
Здравствуйте уважаемые коллеги

упс, извините не хотел с ботом общаться ((

если Рамблер лазит - увеличить тариф и трафик, если боты парсят - закрыть

Здесь не могла быть ваша реклама
Деймос
На сайте с 10.09.2008
Offline
138
#3
tommy-gung:
замечательное обращение

Запятая то есть, он правильно написал ;) Казнить, нельзя помиловать! (с)

M5
На сайте с 28.12.2005
Offline
135
#4
tommy-gung:
если боты парсят - закрыть

Можно попросить примеры, варианты?

K
На сайте с 31.01.2001
Offline
737
#5

А разве робот Рамблера понимает Crawl-delay ? Я нигде этого не видел.

Гуманно можно на какое-то время вообще закрыться от робота Рамблера:

User-agent: StackRambler

Disallow: /

Если это поможет, то думать, что делать дальше. А первым делом нужно в логи смотреть и проверить User-agent, вдруг это и не робот совсем.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
[Удален]
#6

Сколько трафика скушал бот?

сколько весит ваш сайт (вместе с бд), без картинок и медиа контента (примерно)?

M5
На сайте с 28.12.2005
Offline
135
#7
Деймос:
Используйте robots.txt Пример:

User-agent: * (тут вместо звездочки можете указать своего бота в вашем случаи рамблера)
Crawl-delay: 0.5

Может быть я не совсем понимаю, по по статистике у меня есть только ИПы, и вроде бы рамблеровские. Т.е. указать задержку, так как Вы написали?

Michael-5 добавил 15.09.2008 в 16:29

dostelon:
Сколько трафика скушал бот?
сколько весит ваш сайт (вместе с бд), без картинок и медиа контента (примерно)?

В том и кроется причина, что сайт весь весит 35 метров(статика), а скушал он дай Бог только за сегодня 10 Гиг, вот и сработала защита.

P.s. как мне сказал хостер могут быть происки конкурентов и надо искать решение ввиде защиты скриптами... А какими, - я понятия не имею...

Деймос
На сайте с 10.09.2008
Offline
138
#8
Michael-5:
Может быть я не совсем понимаю, по по статистике у меня есть только ИПы, и вроде бы рамблеровские. Т.е. указать задержку, так как Вы написали?

Ну если чесно Kost прав, тут сунулся рамблер действительно не понимает эту дерективу. И еще я отпечатался выше, там надо не 0,5 а 2 или 3 и т.д это тайм аут в секундах. Извиняюсь за недостоверную информацию :o

Сайт бы показали, всеб вместе посмотрели, придумали бы авось что нить!

K
На сайте с 31.01.2001
Offline
737
#9

Сайт - фиг с ним, надо сперва логи посмотреть, хотя бы несколько строчек с заходами с этих IP.

M5
На сайте с 28.12.2005
Offline
135
#10
Kost:
Сайт - фиг с ним, надо сперва логи посмотреть, хотя бы несколько строчек с заходами с этих IP.

Коллеги, спасибо, сейчас выну строки с логов с заходами... 15 мин...

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий