Понимает ли робот Яндекса HTTP 429 Too many requests?

12
RA
На сайте с 30.03.2009
Offline
119
2486

Здравствуйте!

Не было ли у кого в практике случая, когда робот Яндекса валил сайт запросами? У нас такое с нового года, наваливает с кучи адресов, нагрузка растет в сотни раз. Регулировка частоты обхода через админку заметно на проблему не влияет. С abuse@yandex пишут что да, это наши роботы, разбираемся. Пока решение только одно, 503 на запросы с сетей яндекс интерпрайз. Может кто знает, понимает ли Яндекс HTTP 429? Экспериментально проверять проблематично.


Genius Ideaing
На сайте с 12.02.2024
Offline
63
#1
Rosso Azzurro :
Регулировка частоты обхода через админку заметно на проблему не влияет

регулировка поможет... просто она работает не мгновенно..

могут пройти сутки, двое.. прежде чем ваша регулировка частоты доступа робота Янда к сайту не будет учтена..

такое было и в Гугле.. когда он позволял регулировать частоту доступа к сайту своему роботу.... через 1-2 суток применялось правило...

последнее время пока все ОК и с одной и с другой ПС

Дешёвый хостинг и домены: https://clck.ru/3FxXCa / Мощный хостинг: https://clck.ru/3DKmVu / Есть Идеи! Ищу хороших людей для реализации этих идей! Мой Telegram: https://clck.ru/396JFF
BrickLayer
На сайте с 13.06.2020
Offline
109
#2
Было, аж дым с серверов шёл. Года 3 назад, забанил его вообще в .htaccess
Через день разбанил, всё ок. Через месяц опять начал, я ему опять по шапке. Больше не заваливал запросами и вел себя культурно.
G6
На сайте с 12.07.2007
Offline
176
#3
Самый просто вариант, отлавливаешь  user agent, а робот яндекса представляется. Дальше лимит на доступ в минуту или что актуально и бан (любой вариант ответа) на минут 10 или больше. Скриптов такого рода навалом в сети, не конкретно под яндес но на бан на время. Подключать скрипт в .htaccess через auto_prepend_file.
Очистите трафик сайта от ботов и накруток ПФ https://antibot.worldwebinfo.ru
Mik Foxi
На сайте с 02.03.2011
Offline
1154
#4
и яндекс и гугл бот скорее отстают при 503, когда им контролируемо начинаешь показывать чтоб успокоились.
Антибот, антиспам, веб файрвол, защита от накрутки поведенческих: https://antibot.cloud/ Форум на замену серчу: https://foxi.biz/
L
На сайте с 25.12.2013
Offline
393
#5
garry69 #:
Дальше лимит на доступ в минуту или что актуально и бан (любой вариант ответа) на минут 10 или больше.

Наверное, через CF такое тоже можно настроить, тогда не нужно будет всякие скрипты лепить, нагружая собственный сервер.

Недорогой, надежный и отзывчивый VPS хостинг ( https://bit.ly/3eXUnNN ) Проверенная пуш партнерка с ежедневными выплатами ( https://vk.cc/9wLSrL)
Mik Foxi
На сайте с 02.03.2011
Offline
1154
#6
Lastwarrior #:

Наверное, через CF такое тоже можно настроить, тогда не нужно будет всякие скрипты лепить, нагружая собственный сервер.

клаудфлар не знает сколько сейчас способен вытянуть ваш сервер. а на всякий случай блочить нерационально.

на клаудфларе блочить всех ненужных ботов на постоянку. чтоб на сайте уже были только люди, гугл и яндекс боты.

а дальше 1 строка кода: если гугл/яндекс бот и LA выше чем предельная нагрузка при которой ваш сайт еще норм работает - тогда и отдавать 503 гугл/яндекс ботам. И людям не мешает и для seo в целом не критично.

старинная проверенная схема применяемая во многих дорвеях, работает как часы 😀

Д
На сайте с 01.04.2012
Offline
150
#7
Сервер нормальный приоритете и не будете замечать таких проблем
VPN/SSD VPS в любой локации на выбор ( https://cp.inferno.name/cart.php ). Скидка 25% для новых заказов по промо-коду: TEAM
Mik Foxi
На сайте с 02.03.2011
Offline
1154
#8
Дадуда #:
Сервер нормальный приоритете и не будете замечать таких проблем

Это слишком просто ))) потратить лишние пару баксов на норм сервер.

L
На сайте с 25.12.2013
Offline
393
#9
Дадуда #:
Сервер нормальный приоритете и не будете замечать таких проблем

Это работает, если траффик маленький, на больших и нагруженных проектах такое не прокатит и будет выливаться в кругленькую сумму, так как помимо оплаты дополнительных ресурсов нужно будет придумывать систему распределения нагрузки по серверам и т.п. Зачем?

RA
На сайте с 30.03.2009
Offline
119
#10
Всем спасибо! Настройка бегунка скорости индексирования была выставлена годы назад и всё было хорошо, но вот под новый год что-то поменялось и нагрузка выросла в 400 раз. На такие шуточки ни один нормальный рабочий сервер не рассчитан. Быстренько встроили прокладку, которая отдает то, что мы считаем нужным (актуальную матрицу товаров) и отстреливает запросы куда не следует (запрет в robots.txt яндексботу не указ, да и не все им удобно описывать). Так нагрузка снизилась до 10-20x и это железка тянет нормально.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий