Помощь в фильтрации ботов через CloudFlare

O0
На сайте с 17.02.2024
Offline
1
#1231

sh241 #:

Можете ли вы пояснить ваше правило? Моему сайту совсем плохо от наплыва всех этих ботов и текущих проблем. За месяц показатели все снижаются из поиска. Смотрела на разных ветках, сайтах правила против ботов. Первые два правила поставила как у вас (в моем скрине) - а вот последующие из других источников. 
Так вот после ваших двух правил, прямые переходы практически исчезли. Но появились внутренние переходы. Прикрепила данные метрики за месяц и за вчерашний день. Как видно прямые заходы ушли, пришли внутренние. Посещаемость конечно, из поиска упала в хлам. Так хотела понять, что дает второе правило? Вы его скомпоновали в одно? У меня в третьем скрине видно еще 3 правила. 3 правило капча на это

(ip.geoip.asnum in {21453 50241 35807 15640 42116 41344 47395 3216 42437 48190 41330 39655 15378 12714 41733 29497 16345 25159 8359 31213 31133 12958 12389 201123 31224 48092 56407 6697 31163 47524 34411 64432 43761 16345 29124 39811}) 

4 и 5 правило, по-ходу дублирует кое-что из ваших настроек второго правила. Делаю попытки оживить свой сайт, но нужна помощь опытных 😊. За любые советы, помощь благодарю заранее!

Второе правило, на него показ капчи:

(ip.src in {::/0}) or (not ssl) or (not http.request.version in {"HTTP/2" "HTTP/3" "SPDY/3.1"}) or (http.referer eq "") or (http.referer eq "-") or (ip.geoip.country in {"AF" "AX" "AL" "DZ" "AD" "AO" "AI" "AG" "AW" "BH" "BD" "BB" "BZ" "BJ" "BT" "BO" "BQ" "BW" "BN" "BF" "BI" "KH" "CM" "CV" "CF" "TD" "CL" "CN" "CX" "CC" "CO" "KM" "CG" "CD" "CK" "CR" "CI" "CW" "DJ" "SV" "GQ" "ER" "ET" "FK" "FO" "GA" "GM" "GH" "GI" "GD" "GP" "GT" "GG" "GN" "GW" "GY" "HT" "HN" "IN" "ID" "IR" "IQ" "JM" "JE" "JO" "KE" "KI" "KW" "LA" "LB" "LS" "LR" "LY" "MK" "MW" "ML" "MT" "MQ" "MR" "MU" "YT" "MS" "MZ" "MM" "NA" "NR" "NP" "NC" "NI" "NE" "NG" "NU" "OM" "PK" "PW" "PS" "PA" "PG" "PY" "PN" "QA" "RE" "RW" "BL" "SH" "KN" "LC" "PM" "VC" "WS" "SM" "ST" "SA" "SN" "SL" "SB" "SO" "ZA" "SS" "SD" "SR" "SJ" "SY" "TW" "TZ" "TL" "TG" "TK" "TO" "TT" "TN" "TV" "UG" "UY" "EH" "YE" "ZM" "ZW" "T1"}) or (ip.geoip.asnum eq 49505) or (ip.geoip.asnum eq 35048) or (ip.geoip.asnum eq 206766) or (ip.geoip.asnum eq 207713) or (ip.geoip.asnum eq 52207) or (ip.geoip.asnum eq 16509) or (ip.geoip.asnum eq 23033) or (ip.geoip.asnum eq 48061) or (ip.geoip.asnum eq 14061) or (ip.geoip.asnum eq 200197) or (ip.geoip.asnum eq 14618)

png cdmqsg_b3z0ei_2024-03-16_151252.png
png wp0mt8_vlqlw0_2024-03-16_135211.png
png eexmj5_2pqb8b_2024-03-16_150950.png
юни
На сайте с 01.11.2005
Offline
902
#1232
john_j #:
это реальный Google, или кто-то маскируется под него ?
Маскируются.
https://a-parser.com/ - парсер для профессионалов SEO, маркетологов, арбитражников и SaaS, https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
-S
На сайте с 10.12.2006
Offline
1356
#1233
john_j #:

Сегодня наблюдал очень много заходов из сети Hetsner c User Agent Googlebot.
Как считаете, это реальный Google, или кто-то маскируется под него ?



У всех крупных компаний свои отдельные AS, которые можно нагуглить. Все AS хостеров можно смело блочить.

O
На сайте с 17.12.2023
Offline
3
#1234

Всё, что прошло через флару превращается во внутренние переходы по метрике. Это ни на что не влияет, не переживайте. Не знаю, что и как у Вас настроено. Принцип должен быть такой. 1) Первое правило, пускаем белых ботов, но исключаем mail.ru  облачные сервисы гугла. Пропускаем ботов рамблера и системы оплаты например у нас подключено Юмани. Пропускаем все ip адреса ботов которые выложил яндекс в открытый доступ. Пропускаем толокеров, и пропускаем Вк роботов которые дёргают сниппеты для постов и тп в Вконтакте.

Вторым должно быть правило которое блокирует всю чушь, например у нас стоит все кто не из России в блок. Почему? Да потому что пусть лучше мне напишет человек(нам пишут в Вк), что не может попасть на сайт, я пойму, что он использует ВНП пытается зайти из другой страны и тд. Я ему объясню что нужен доступ из России. Чем буду с "такими" пускать ещё кучу мусора из-за бугра на свой сайт. Ещё как вариант можете сделать правило редирект там же на фларе, что если не из Вашей страны, то пусть человек идёт на такой-то адрес страницы. Главное исключить белых ботов. Создаёте по этому адресу страницу информационную типа "бла бла бла выключи VPN". Всё любой кто прётся не из России будет на нее закольцован. Также блокируем Tor  и неизвестные регионы. Блокируем все юзер агенты в которых встречается Bot,bot,BOT,Spyder,Spider,spider,spyder,crawl,Crawl,python,Python. Пустой и пробел юзерагент, HTTP/1.0 ,  всё что имеет уровень опасности выше 20 по мнению флары. Закрываем также если URL содержит sitemap, и рефер содержит redirect, googleusercontent.com. Закрываем AS47764, т.е в первом мы пустили ботов Вконтакте которые дергают сниппет, а тут остальным закрываем. Нечего им  делать на сайте.

3-е правило тоже блокируем всех опасных ботов из распространённого списка. Исключая тех кто содержит в названии Bot,bot,BOT,Spyder,Spider,spider,spyder,crawl,Crawl,python,Python. Поэтому должно поместиться из 2-х списков в 1, ну не влезет около 10-20 шт. из можно добавить во второе, там будет места достаточно.

4) И вот только тут переходим Manage Challenge: показываем всем кто пришёл из поисковых систем, то бишь рефер например yandex.ru/kz/by и тд, если рефер пустой. И если протакол http/1.1 и 1.2

5) Проверка JS Challenge всем кто прётся не https, важно чтобы у Вас был сертификат и работало https и также добавить правило редиректа там же на фларе с что все кто идёт по http перенаправляло на https. Хз галочка в настройках у них почему-то не работает, если ручками прописать, то всё хорошо.  Также проверка если рефер не Ваш сайт. 

Т.е. про итогу должно быть так, сначала пускаем всех хороших, потом точно баним всех плохих. А последние 2 правила - проверка всех остальных на вшивость. 

Ещё флара пускает в белых ботах amason, semrash, эти сети нужно отдельно забанить в последней вкладке. Нельзя ни в коем случае просто так пускать всех из известных сетей, сейчас куча облачных сервисов в этих же сетях, где можно взять вдс-ку и чё угодно творить.  

А ещё тут на форуме сидят те самые ушлёпки которые пускают на Вас ботов, которые будут Вам советовать такие настройки которые не заблокируют их;) Я вот собрал список около 700 ip из ростелекома и ещё 2 сетей с ботами, интересно подгадит им жить если выложить, сколько стоит сейчас купить прокси 150 рублей? тогда около 10к в рублях на новые придётся им потратить, это мала... нужно копить собрать по максимому. А потом выложить подосрать ушлёпкам.

V1
На сайте с 14.03.2007
Offline
147
#1235
Odimidorius #:
Вторым должно быть правило которое блокирует всю чушь, например у нас стоит все кто не из России в блок. Почему? Да потому что пусть лучше мне напишет человек, что не может попасть на сайт, я пойму, что он использует ВНП пытается зайти из другой страны и тд.

Скорее всего пользователь пошлет подальше такой сайт, а не будет что-то писать.

Odimidorius #:
Чем буду с "такими" пускать ещё кучу мусора из-за бугра на свой сайт.

Всем известно где находится наибольшее количество ботов.

Odimidorius #:
Ещё флара пускает в белых ботах amason, semrash, эти сети нужно отдельно забанить в последней вкладке.

Сначала бы прочитали документацию КФ, а потом учили других

O
На сайте с 17.12.2023
Offline
3
#1236
john_j #:

Сегодня наблюдал очень много заходов из сети Hetsner c User Agent Googlebot.
Как считаете, это реальный Google, или кто-то маскируется под него ?



Нет, это вот, потому что пускаете по юзерагент. А нужно дать фларе пустить фларе ботов которых она знает, так как у Яндекс могут быть новые, то пустить все ip которые яндекс выложил на всеобщее обозрение. Ну в крайнем случае у Вас должно быть привязка юзерагент должен совпадать с сетью. Т.е. например агент Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) и его сеть должна быть AS15169. Если не совпадает, то не пускает.

O
На сайте с 17.12.2023
Offline
3
#1237
vitaliy11 #:

Скорее всего пользователь пошлет подальше такой сайт, а не будет что-то писать.

Всем известно где находится наибольшее количество ботов.

Сначала бы прочитали документацию КФ, а потом учили других

Пожалуйста, можно не банить. Я написал, что можно перенаправить их на страницу на которой будет инфа "выключи ВПН".  Куча мусора, зачем мне он нужен, если я за бугром не торгую. И основная масса людей редко использует VPN на постоянной основе. Нужно знать ещё свою аудиторию конечно. А что не так по amason, semrash? Не даём собирать статистику и сканировать свой сайт всем кто пользуется Семраш, зачем их пускать, пусть оптимизаторы на других тренируются. Что не так?  

Я вот тут чуши всякой начитался когда первый раз настраивал, и понял кто тут и что советует. Сам разобрался и мне нравится статистика моего сайта, с 24% отказов упали до 9-11%, время на сайте выросло с 1.09 до 16.00-22.00 минут, и глубина просмотра с 1 до 3. Позиции растут и меня устраивает. А по советам "некоторых" товарищей всё было печально) 

V1
На сайте с 14.03.2007
Offline
147
#1238
Odimidorius #:
Что не так по amason, semrash? Не даём собирать статистику и сканировать свой сайт, всем кто пользуется Семраш, зачем их пускать. Что не так?

Почитайте документацию как работают правила в WAF (ну или читайте эту ветку - уже обсуждалось). Еще скажите что при таком правиле блокируются боты из белого списка КФ )

vashfreelancer
На сайте с 24.10.2023
Offline
28
#1239
Odimidorius #:
Первое правило, пускаем белых ботов

Уже неверно. 

vitaliy11 #:
Ещё флара пускает в белых ботах amason, semrash, эти сети нужно отдельно забанить в последней вкладке.

Второй раз неверно. Если Вы разрешаете первым правилом (Known Bots - белых ботов) их, то правилом ниже вы не забаните (тот же семраш). В клауде важен порядок. Не предоставляйте неверную информацию.

Odimidorius #:
Исключая тех кто содержит в названии Bot,bot,BOT,Spyder,Spider,spider,spyder,crawl,Crawl,python,Python

Зачем исключать? По-моему вы троллите.

Odimidorius #:
показываем всем кто пришёл из поисковых систем, то бишь рефер например yandex.ru/kz/by

Зачем капча для заходов из поиска? Вы хотите чтобы у человека вообще клиентов небыло?

Odimidorius #:
можно перенаправить их на страницу, на которой будет инфа "выключи ВПН

На бесплатном тарифе нельзя делать кастомный HTML или редирект, как вы собираетесь перенаправлять?

Защита сайта от ботов - накрутки ПФ, роботность, DDoS, Cloudflare ДДос - https://vashfreelancer.com
O
На сайте с 17.12.2023
Offline
3
#1240
vitaliy11 #:

Почитайте документацию как работают правила в WAF (ну или читайте эту ветку - уже обсуждалось). Еще скажите что при таком правиле блокируются боты из белого списка КФ )

Да  что хотите сказать то никак не пойму, про что речь? При каком правиле блокируются боты из белого списка? Я говорю что amazon и semrash сама флара считает за белых ботов.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий