Бот от cloudflare?

123 4
LevShliman
На сайте с 03.09.2018
Offline
187
#11
pegs #:

Скорее всего так и есть. А может быть это какой-то анализатор от CF, какой User-Agent прописывает в логах?

А от этого можно закрыться клиентским сертификатом CF, тогда напрямую сможет только CF забирать контент.


Ещё как вариант можно написать с конкретикой по логам на

All Cloudflare abuse reporting can be done via https://www.cloudflare.com/abuse

Что-то ответят.

в логах (compatible; Barkrowler/0.9; +https://babbar.tech/crawler)

About the Babbar's bot: Barkrowler
  • www.babbar.tech
- Bot type : Crawler (identify itself) - Version: 0.9 - Follows robots.txt - Follows crawl delay - Barkrowler has no fix ip range - Reverse DNS suffix: babbar.eu Babbar.tech is operating a crawler service named Barkrowler which fuels and update our graph representation of the world wide web. This database and all the metrics we compute with are...
От сюда хорошо видно, что Вы делаете на этом форуме http://www.fsb.ru
LevShliman
На сайте с 03.09.2018
Offline
187
#12
Mik Foxi #:
А юзерагент какой? У клайдфлара есть бот "олвейс онлайн" который бешенный положить может любой сервер, его в настройках можно выключить чтоб не ходил.

А где выключить? 

damn-doubleclick
На сайте с 10.09.2021
Offline
54
#13
LevShliman #:

в логах (compatible; Barkrowler/0.9; +https://babbar.tech/crawler)

Вообще такое блокируется в тарифе Business как "Likely Automated Traffic". 

Я сам блокирую любой запрос если у User Agent присутствует "crawler". Никаких проблем. 

Лучший хостер с адекватными сис. админами: https://clck.ru/35zGfN
damn-doubleclick
На сайте с 10.09.2021
Offline
54
#14
LevShliman #:

А где выключить? 

Можно отключить в настройках Cloudflare, а если это не поможет то ищите список ботов archive.org и добавьте User Agent ботов в чёрный список Firewall. 

pegs
На сайте с 07.06.2007
Offline
658
#15
LevShliman #:
в логах (compatible; Barkrowler/0.9; +https://babbar.tech/crawler)

Это явно не бот от CF. Вероятно работают через VPN, вроде CF предоставляет что-то подобное.

Вы ещё внимательно заголовки запросов и настройки веб-сервера поизучайте, возможно не подменяются (или только частично подменяются) при проксировании адреса CF на внешние IP. Поэтому вы видите в логах IP адреса СF, вместо реальных.

«Палата номер 6» ищет своего Главврача: https://www.palata6.ru/
LevShliman
На сайте с 03.09.2018
Offline
187
#16
damn-doubleclick #:

Можно отключить в настройках Cloudflare, а если это не поможет то ищите список ботов archive.org и добавьте User Agent ботов в чёрный список Firewall. 

У Вас платный тариф, в бесплатном нет таких настроек. 

Я замочил бота добавил в

.htaccess

SetEnvIfNoCase User-Agent "barkrowler" bad_bot

<Limit GET POST HEAD> 

Order Allow,Deny 

Allow from all

Deny from env=bad_bot

</Limit> 


Но теперь пропали все боты и яндекс с гуглом и бингом((

pegs
На сайте с 07.06.2007
Offline
658
#17

А не пробовали добавить в роботс.тхт:

User-agent: barkrowler
Disallow: /
LevShliman
На сайте с 03.09.2018
Offline
187
#18
pegs #:

А не пробовали добавить в роботс.тхт:

пробовал не помогло

AfterWar
На сайте с 28.01.2013
Offline
174
#19

в firewall rules создайте правило Block. Нажмите edit expression и вставьте

 (http.user_agent contains "MJ12bot") or (http.user_agent contains "www.comscore.com") or (http.user_agent contains "SemrushBot") or (http.user_agent contains "GrapeshotCrawler") or (http.user_agent contains "AhrefsBot") or (http.user_agent contains "PetalBot") or (http.user_agent contains "BLEXBot") or (http.user_agent contains "DotBot/1.1") or (http.user_agent contains "Linguee Bot") or (http.user_agent contains "Scrapy") or (http.user_agent contains "Seekport Crawler") or (http.user_agent contains "opensiteexplorer.org") or (http.user_agent contains "python") or (http.user_agent contains "Barkrowler")

Нагрузка ощутимо упадет, бывает и в разы. a ip у них у всех клаудовские  если не определять  real_ip_header CF-Connecting-IP

Barkrowler - это бот компании eXenSa, компания занимается машинным обучением и анализом текстовых данных. Заявленная цель сканирования: определить семантическую или тематическую направленность веб-сайтов и страниц. Основатель компании Guillaume Pitel (Гийом Питель, француз) придумал алгоритм NCISC (пока нет официально опубликованных данных об этом алгоритме).

https://seo.klimin-viktor.com/barkrowler.html

Barkrowler. Что известно об этом боте
Barkrowler. Что известно об этом боте
  • Klimin Viktor
  • seo.klimin-viktor.com
Главная Barkrowler О боте Barkrowler - это бот компании eXenSa, компания занимается машинным обучением и анализом текстовых данных. Заявленная цель сканирования: определить семантическую или тематическую направленность веб-сайтов и страниц. Основатель компании Guillaume Pitel (Гийом Питель, француз) придумал алгоритм NCISC (пока нет официально...
⭐⭐⭐ЛУЧШАЯ АЛЬТЕРНАТИВА ADSENSE (ПЛАТЯТ, И ДЛЯ RU ДЛЯ БУРЖ) ( https://clck.ru/KgyqY )
LevShliman
На сайте с 03.09.2018
Offline
187
#20
AfterWar #:
(http.user_agent contains "MJ12bot") or (http.user_agent contains "www.comscore.com") or (http.user_agent contains "SemrushBot") or (http.user_agent contains "GrapeshotCrawler") or (http.user_agent contains "AhrefsBot") or (http.user_agent contains "PetalBot") or (http.user_agent contains "BLEXBot") or (http.user_agent contains "DotBot/1.1") or (http.user_agent contains "Linguee Bot") or (http.user_agent contains "Scrapy") or (http.user_agent contains "Seekport Crawler") or (http.user_agent contains "opensiteexplorer.org") or (http.user_agent contains "python") or (http.user_agent contains "Barkrowler")

Благодарю, помогло.Научили)

И вроде можно в файле 

.htaccess

SetEnvIfNoCase User-Agent barkrowler bad_bot
Order Allow,Deny
Allow from all
Deny from env=bad_bot

Проверять уже не стал.

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий