Какие есть боты/сервисы, которые стоит добавить в исключения?

12
IM
На сайте с 01.08.2025
Offline
4
984

Настраиваю nginx для блокировки всяких ботов. Задумался о том, чтобы не заблокировать полезных ботов и другие нужные сервисы.

Что нужно добавить в исключения, чтобы случайно не заблокировать?

Если есть конкретные списки ip, прикладывайте, не стесняйтесь. Всем спасибо.

Анти ДДОС
На сайте с 14.03.2020
Offline
119
#1

Вы сначала уточните, про какой именно вид ботов идет речь.

Защита сайта от поведенческих ботов, настройка АнтиБот систем, фильтрация ботов для Яндекс Директ - https://antiddos24.ru
IM
На сайте с 01.08.2025
Offline
4
#2
Анти ДДОС #:

Вы сначала уточните, про какой именно вид ботов идет речь.

Любые. Яндекс, гугл, бинг, ахрефс, чекеры всякие, пинг админы и так далее.

Абсолютно все.

D.iK.iJ
На сайте с 26.05.2013
Offline
237
#3

Потыкал нейронку на этот счет. Где взять IP-адреса хороших ботов?

- Google: https://developers.google.com/search/apis/ip-addresses
- Bing: https://www.bing.com/toolbox/bingbot.json
- Yandex: https://yandex.com/support/webmaster/robot-workings/check-yandex-robots.html (ищите IP-адреса)
- DuckDuckGo: они используют Bingbot, так что те же IP? Но также есть свой бот: DuckDuckBot. Официально: https://duckduckgo.com/duckduckbot
- Applebot: https://support.apple.com/en-us/HT204683
- Baidu: http://help.baidu.com/question?prod_en=master&class=1&id=1000973 (на китайском, но можно найти IP)
- Facebook: https://developers.facebook.com/docs/sharing/webmasters/crawler/
Также полезные сервисы:
- Мониторинг: UptimeRobot, Pingdom, NewRelic и т.д. (они обычно предоставляют список IP)

Но важно: IP-адреса могут меняться, поэтому нужно периодически обновлять.

Альтернатива: использовать DNS запросы для проверки, что IP действительно принадлежит боту (например, для Googlebot можно сделать обратный DNS-запрос и проверить, что имя хоста заканчивается на googlebot.com). Однако, в конфигурации nginx мы не можем делать DNS-запросы на лету.

Адаптивный дизайн в 2 строчки ( https://dikij.com/wm/adaptaciya-saytov.php ). + Принимаю заказы любой сложности ( https://searchengines.guru/ru/forum/926323 ). 💎 Еще я делаю классные кулоны с опалами ( https://mosaicopal.ru/ ).
alaev
На сайте с 18.11.2010
Offline
838
#4
ТС. Действуй от обратного. Пусти только тех ботов, которые тебе нужны.
Создание и продвижение сайтов - https://alaev.net , аудиты сайтов, контекстная реклама
Genius Ideaing
На сайте с 12.02.2024
Offline
86
#5
isy.m :
Настраиваю nginx для блокировки всяких ботов

RewriteCond %{HTTP_USER_AGENT} l9scan|aiohttp|Telegram|WhatsApp|Exabot|Google%20AdWords%20Robot|Chrome%20Privacy%20Preserving%20Prefetch%20Proxy|Buck|scalaj-http|Google-Apps-Script|Thinkbot|Linkfluence%20Yak%20Bot|IAS%20Crawler|Coccocbot|netEstate%20NE%20Crawler|Flyriverbot|AwarioBot|CMS-Checker|Apache-HttpClient|WebartexBot|PerplexityBot|Perplexity-User|Fuzz%20Faster%20U%20Fool|vkShare|Fast-Webcrawler|SeznamBot|VelenPublicWebCrawler|ALittle|InternetMeasurement|Hogwarts|PubMatic%20Crawler%20Bot|Go-http-client|SeopultContentAnalyzer|Mediatoolkitbot|OI-Crawler|Baidu|CensysInspect|WebMeUp|Apple%20Web%20Crawler|Slackbot|Slack-ImgProxy|Linkfluence|Yetibot|DataForSeoBot|DataForSeoBot|ByteDance|GPTBot|bidswitchbot|ChatGPT|OAI-SearchBot|keys-so-bot|ClaudeBot|DotBot|MJ12bot|LinkCheckerBot|TikTokSpider|Amazon|GetIntent|SemrushBot|Twitterbot|PetalBot|VKRobotRB|FaceBook|BrightEdge|Gaislab|AhrefsBot|Archive [NC]


Дешёвый хостинг и домены: https://clck.ru/3FxXCa / Мощный хостинг: https://clck.ru/3DKmVu / Есть Идеи! Ищу хороших людей для реализации этих идей! Мой Telegram: https://clck.ru/396JFF
Artisan
На сайте с 04.03.2005
Offline
378
#6
isy.m :

Настраиваю nginx для блокировки всяких ботов. Задумался о том, чтобы не заблокировать полезных ботов и другие нужные сервисы. Что нужно добавить в исключения, чтобы случайно не заблокировать?


Вы неправильно думаете, надо не запрещать по умолчанию, а позволять по умолчанию, и список не позволений, а запретов, причём временный, только для тех роботов, которые слишком сильно нагружают машину. Иначе запретите много полезных сервисов, с которых могут даром приходить интересные люди, заманить которых другими способами не получится. Если очень постараетесь, то можете удачно запретить тайных роботов популярных искалок, которые могут приходить с любых IP с любыми user agent, чтобы проверять cloaking, и другие хитрости, а потом будете жаловаться, что пропала посещаемость с популярных искалок.





www.leak.info / ДАРОМ линки конкурентов и забытых доменов
IM
На сайте с 01.08.2025
Offline
4
#7
D.iK.iJ #:
Потыкал нейронку на этот счет.

Хорошо, что уточнили. Половина ссылок нерабочие, но некоторые пригодились. Спасибо.

Genius Ideaing #:
RewriteCond

То, что nginx вас не смущает? Ну это ладно, переписать можно.

Но проблема в другом - надо именно ip-шники. Юзерагент можно подделать, это не надежно.

Artisan #:
Вы неправильно думаете

У меня свои причуды. Этот список будет как перестраховка. Никто не собирается всех блочить.

Но за замечание спасибо. Кому-нибудь пригодится.

IM
На сайте с 01.08.2025
Offline
4
#8
Кто-то знает где найти все ip Вконтакте, одноклассников, mail ru, telegram, whatsapp, viber, twitter?
Анти ДДОС
На сайте с 14.03.2020
Offline
119
#9
isy.m #:
Вконтакте, одноклассников, mail ru

Это одно и то же.

https://bgp.tools/as/47541#prefixes
https://bgp.tools/as/47764#prefixes
https://bgp.tools/as/28709#prefixes

AS47541 VKontakte Ltd - bgp.tools
AS47541 VKontakte Ltd - bgp.tools
  • bgp.tools
VKontakte Ltd (AS47541) is a 17 year old BGP network that is peering with 76 other networks and has 6 upstream carriers
IM
На сайте с 01.08.2025
Offline
4
#10
Анти ДДОС #:
https://bgp.tools/as/47541#prefixes
https://bgp.tools/as/47764#prefixes
https://bgp.tools/as/28709#prefixes
У них нет нигде информации об этом в справке?
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий