Боты создают нагрузку на сервер

123
Психиатр
На сайте с 16.11.2010
Offline
360
#11

где эти все 200 или 304 смотреть? :)

94.228.204.10 - - [01/Oct/2013:16:55:07 +0400] "GET //page.php HTTP/1.0" 301 339 "-" "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.13 (KHTML, like Gecko) Chrome/24.0.1290.1 Safari/537.13"

109.94.0.100 - - [01/Oct/2013:16:55:07 +0400] "GET //page.php HTTP/1.0" 301 339 "-" "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/537.13 (KHTML, like Gecko) Chrome/24.0.1290.1 Safari/537.13"

Mik Foxi
На сайте с 02.03.2011
Offline
1177
#12

Психиатр, у вас в логах 301 (редирект).

Антибот, антиспам, веб файрвол, защита от накрутки поведенческих: https://antibot.cloud/ Форум на замену серчу: https://foxi.biz/
AlexandrSG
На сайте с 14.11.2010
Offline
74
#13

User-Agent: *

Disallow: /?

Disallow: /search_all/

Disallow: /obratnyj_zvonok/

Disallow: /obratnyj_zvonok_rezultat/

Disallow: /admin

Disallow: /index.php

Disallow: /emarket/addToCompare

Disallow: /emarket/basket

Disallow: /go_out.php

Disallow: /search

Disallow: /users

Crawl-delay: 3 - задержка для ботов, у некоторых видел 10 даже стоит

Host: site.ru

Sitemap: http://site.ru/sitemap.xml

ЗЫ изучать конкурентов не пробовали?

Консультации, Inside/Outside (/ru/forum/809679) оптимизация/продвижение
Психиатр
На сайте с 16.11.2010
Offline
360
#14
foxi:
Психиатр, у вас в логах 301 (редирект).

Так и есть. Но у меня в этой папке и главное зеркало и неглавное, а логи одинаковые для них.

Ладно, пойду пока вот этих гондурасов банить.

DenisVS:
Если есть возможность, лучше банить не в .htaccess, а в location nginx, так значительно меньше нагрузка.

Возможность для этого всегда есть. Понять бы что это еще.

AlexandrSG
На сайте с 14.11.2010
Offline
74
#15

ТС, а не проще разрешить только гуглу, яше, рамблер, маил.ру, сканить (тех - которые нужны) ☝

Психиатр
На сайте с 16.11.2010
Offline
360
#16

Конечно проще. Осталось только ерунда совсем: научиться это сделать.

AlexandrSG
На сайте с 14.11.2010
Offline
74
#17
Психиатр:
Конечно проще. Осталось только ерунда совсем: научиться это сделать.

http://web-install.ru/info/info_44.html - по яше, описание ботов.

По остальным информацию тоже не сложно найти.

ЗЫ можно даже банить отдельно ботов которые выявляют ГС, но это еще тестить нужно ☝

Психиатр
На сайте с 16.11.2010
Offline
360
#18
AlexandrSG:
http://web-install.ru/info/info_44.html - по яше, описание ботов.
По остальным информацию тоже не сложно найти.

Вы считаете этим реально проще заняться?А где гарантия что этот гавносайт не пропустил какого нибудь бота? Вот здесь например 22 бота, а не 14.

AlexandrSG
На сайте с 14.11.2010
Offline
74
#19
Психиатр:
Вы считаете этим реально проще заняться?

Реализация дольше но, более тонкая настройка на большом промежутке времени даст лучшие результаты.

Имхо.

Для ГС конечно нет смысла так заморачиваться.

_2
На сайте с 30.05.2007
Offline
171
_t2
#20
Психиатр:
Пытаюсь банить через .htaccess:

Order Allow,Deny
Allow from all
Deny from 109.94.0.100
Deny from 94.228.204.10

А эти два адреса всё равно долбятся ко мне каждую секунду. Чудеса? Или это у меня руки из жопы растут?
Банить всю подсеть, типа Deny from 109.94.0 все равно не помогает.

Блокировать их лучше через iptables. Ещё советую установить fail2ban - весьма полезная вещь. У Вас есть доступ к SSH? Дайте команду iptables -L -n -v для проверки настроек брэндмауера. Чтобы добавить ip адрес в блок дайте команду: iptables -I INPUT -s ip.ip.ip.ip -j DROP и не забудьте сохранить настройки.

Пользоваться .htacces для этих целей не стоит - это всё равно это создает серьёзную нагрузку.

AlexandrSG:
Crawl-delay: 3 - задержка для ботов, у некоторых видел 10 даже стоит

Подавляющая часть назойливых ботов даже не загружает robots.txt перед тем как начать сканирование сайта. Crawl-delay поможет только от самых культурных, вроде маджестика.

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий