Боты создают нагрузку на сервер

12 3
Психиатр
На сайте с 16.11.2010
Offline
360
5860

Подскажите, какие современные роботы пауки сегодня больше всего грузят сервер? Типа, SolomonoBot. Ссылки на блоги с Bing [Bot] и MSN [Bot] не давайте, я это уже все видел. Интересует кто сейчас промышляет из новых. Может какие то еще seo-сайты этим промышляют.

И насколько имеет смысл банить вот таких вот "xpymep", или "SearchBot" если они все равно шифруются под других ботов.

И раз вы все равно уже сюда зашли, помогите с программой которая определяет нагрузку на сервер без использования логов. На WordPress например, есть плагины (типа - http://seom.info/2010/04/21/nagruzka-na-sait/). А если сайты не на WordPress но тоже очень хочется узнать?

У меня по ночам один из сайтов начинает страшно тупить, хочу понять причину. Писал в Мастерхост чтобы логи посмотрели, так как я в этом баран, они послали меня нахрен в вежливой форме.

Спасибо за помощь.

HR
На сайте с 17.02.2007
Offline
210
#1
Психиатр:

У меня по ночам один из сайтов начинает страшно тупить, хочу понять причину. Писал в Мастерхост чтобы логи посмотрели, так как я в этом баран, они послали меня нахрен в вежливой форме.

Я в свое время уже послал мастерхост за нежелание убирать вирусню. Советую сделать так же.

А уверены, что из-за ботов вообще? Может они по ночам профилактику делают, от этого и тормоза.

Психиатр
На сайте с 16.11.2010
Offline
360
#2

Думаю что не в Мастерхосте дело. Сайт был на Мажордоме, потом перенес на Мастерхост, потом на Петерхост, потом еще на один ... в общем, всемирная история банкимпериал. Везде ситуация одна и та же - месяц сайт сидит хорошо на новом хостинге а потом начинается тупняк.

Но это хрен с ним, у меня есть сайты на голом html и на разных хостингах - и те по ночам тормозят. Короче, речь не про хостинг, мне бы программку, если есть такое.

И еще бы забанить тот робот гугла который проверяет обратные ссылки - покупные они или нет.

IL
На сайте с 20.04.2007
Offline
435
#3
Психиатр:
У меня по ночам один из сайтов начинает страшно тупить, хочу понять причину. Писал в Мастерхост чтобы логи посмотрели, так как я в этом баран, они послали меня нахрен в вежливой форме.

Что в логах стоит напротив времени, которое попадает в период "тупления" сайта? Логи ведь доступны (из панели или по FTP)?

HardeR:
Я в свое время уже послал мастерхост за нежелание убирать вирусню. Советую сделать так же.

Эм. .m - это хостинг. Они предоставляют ресурсы. Формально, следить за "чистотой" на площадке (а тем более залатывать дыры в скриптах) в их прямые обязанности входить не должно.

p.s. какой движок у сайта?

... :) Облачные серверы от RegRu - промокод 3F85-3D10-806D-7224 ( http://levik.info/regru )
Психиатр
На сайте с 16.11.2010
Offline
360
#4
ivan-lev:
Что в логах стоит напротив времени

Какие то цифры. :) Типа 85.17.73.171. Много вот такой байды: AppleWebKit/537.51.1 (KHTML, like Gecko) Version/6.0 Mobile/11A465 Safari/8536.25

Я думал мож какой график есть по нагрузке чтобы посмотреть все сразу, как по ссылке в первом посте.

что такое AppleWebKit? :) забивать или пусть живет?

IL
На сайте с 20.04.2007
Offline
435
#5
Психиатр:
что такое AppleWebKit? забивать или пусть живет?

Это, видимо

Психиатр:
Типа, SolomonoBot

притворяется..

IP 85.17.73.171
LeaseWeb B.V.
Хост: spider02.solomono.ru

* ну, или кто-то с сервака под mac-ом сидит.. возможно, через прокси.. я лично сомневаюсь..

Если не ожидается посетителей из leaseweb-а, можно по IP доступ ограничивать.. Хотя...

Mik Foxi
На сайте с 02.03.2011
Offline
1076
#6

Из именных ботов, которые слишком активные, я баню:

AhrefsBot|ApacheBench|Aport|Baiduspider|Birubot|bsalsa|Butterfly|CamontSpider|discobot|DoCoMo|DotBot|Ezooms|FairShare|FlaxCrawler|FyberSpider|Gigabot|gold|HTTrack|ia_archiver|InternetSeer|Java|JS-Kit|kmSearchBot|larbin|libwww|Linguee|LinkExchanger|lwp-trivial|MJ12bot|MLBot|NerdByNature|NING|NjuiceBot|Nutch|pflab|PHP/|PostRank|ptd-crawler|Purebot|PycURL|Python|SearchBot|SiteBot|SolomonoBot|Soup|spbot|suggybot|Superfeedr|SurveyBot|SWeb|ttCrawler|UnwindFetchor|User-Agent|uTorrent|Voyager|Wget|WordPress|Yeti|YottosBot|Zeus|ZmEu

Из хитрожопых ботов, прячущихся под обычные браузеры - банить можно сразу подсети таких датацентров как хенцзер, лизвеб, мастерхост, + всю индию, китай, тайвань и прочую азию...

Антибот, антиспам, веб файрвол, защита от накрутки поведенческих: https://antibot.cloud/ + партнерка, до 40$ с продажи.
Психиатр
На сайте с 16.11.2010
Offline
360
#7

Пытаюсь банить через .htaccess:

Order Allow,Deny

Allow from all

Deny from 109.94.0.100

Deny from 94.228.204.10

А эти два адреса всё равно долбятся ко мне каждую секунду. Чудеса? Или это у меня руки из жопы растут?

Банить всю подсеть, типа Deny from 109.94.0 все равно не помогает.

IL
На сайте с 20.04.2007
Offline
435
#8
Психиатр:
А эти два адреса всё равно долбятся ко мне каждую секунду. Чудеса? Или это у меня руки из жопы растут?

Код ответа сервера в логе какой? если 403 - работает.

p.s. Проще всего проверить, добавив свой IP-шник

DV
На сайте с 01.05.2010
Offline
644
#9

Баню всех, кто не хочет понимать Crawl-delay.

Если есть возможность, лучше банить не в .htaccess, а в location nginx, так значительно меньше нагрузка.

VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )
Mik Foxi
На сайте с 02.03.2011
Offline
1076
#10

Психиатр, так ломиться будут, но в логах теперь должно быть код не 200, а 304

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий