sagamorr

Рейтинг
237
Регистрация
12.10.2012
11
sochi-russia #:

На 100% не решил, но большую часть отсек, поставил запрет на посетителей без куки и поддержки js.

У меня ни на одного бота не убавилось, когда хостер врубал такую настройку. У вас какие то простые боты были видимо.
Datot #:

На закусочку, чтобы мысли зашевелились

при проверке обнаружили некоторые нежелательные запросы от IP
178.210.44.152, в настоящий момент заблокировано.

При детальном анализе логов за 14 марта, пришли в к выводу, что на сервер
приходит очень большое количество запросов, общее количество 422196. Много
запросов от различных ботов, информация по основным из них:

[root@......ru ~] # bzcat /var/log/nginx/*/access.log-20230308.bz2 | wc -l
422196
[root@.......ru ~] # bzgrep 'MegaIndex.ru' /var/log/nginx/*/
access.log-20230308.bz2 | wc -l
36306
[root@.......ru ~] # bzgrep -i 'yandex.com/bots' /var/log/nginx/*/
access.log-20230308.bz2 | wc -l
56980
[root@.......ru ~] # bzgrep -i 'SemrushBot' /var/log/nginx/*/
access.log-20230308.bz2 | wc -l
25661



Так кого будем блочить?

Это они через прямые заходы 422196 запросов наделали?😀

Если хотя бы половина вебмастеров защиту от ботов поставят, такие как вы, работы лишитесь, так что очень понимаю ваше беспокойство😁

sochi-russia #:

Медленные сайты ни одна пс и пользователи не любят, готовьтесь

Для ПС стоит исключение, живого трафика с прямых заходов практически нет, тот кто очень хочет посетить сайт, 2-3 сек подождет, не проблема.

На трафик с поиска и рекламы, никаких проверок нет.

Вы так и не ответили в другой теме, каким способом решили проблему прямых заходов.

Kykapa4a #:

Тоже присутствуют заходы с этих сетей по IPv6.

IP6 просто на хостинге отключите и все.
Mik Foxi #:

это выкашивает около 60% ботов, тупо потому что это тратит время бота и он не успевает остальное загрузить. но этот процент постоянно падает, все что нужно боту это настроить его чтоб при виде страницы проверки он подождал чуть больше, в остальном клаудфлар не считает этих ботов ботами.

У меня количество прямых заходов сократилось в 10 раз.

Managed Challenge - использует метод на усмотрение системы. Это может быть: блокировка, капча или ожидание 2-3 сек.

И что самое главное такие проверку идут только для трафика с прямых заходов. На трафик с рекламы или поиска никаких ограничений нет.

Самое оптимальное решение для борьбы с ботами (на мой взгляд), которые идут по прямым заходам - установка cloudflare и отправка директ трафика на проверку Managed Challenge.

У меня большинство ботов выкосило таким способом.

Inferno5533 #:

Вы закрыли доступ для ботов Яндекса и др. Просто добавьте в WAF следующее правило и ошибки не будет.

Да, там было циклическое перенаправленные из-за того, что редирект на https стоял на хостинге и на cloudflare.

Cloudflare реально вычистил почти всю эту дрянь, можно в этом топике в первом сообщении закрепить инструкцию по настройке WAF от прямых заходов.

AfterWar #:

Список Known Bots - то что пропускает Cloudflare

ahrefs

Ahrefs SEO bot

apple

Applebot is the web crawler for Apple, for products like Siri and Spotlight Suggestions

archive.org

Archive.org bots

baidu

Baidu search engine bots

better uptime

Bot for monitoring website uptime

bing

Bing search engine bots

feedbin

Feedbin.com bots

google

Google search engine bots

grapeshot

Grapeshot (Oracle) SEO bots

linkedin

LinkedIn bots

mail.ru

Mail.ru bots

naver

Naver (South Korean) search engine bots

pingdom

Pingdom.com monitoring bots

pinterest

Pinterest bots

seznam

Seznam search engine bots

sogou

Sogou search engine bots

uptimerobot

Uptime Robot monitoring bots

yahoo

Yahoo! search engine bots

yandex

Yandex search engine bots

***

Если правило  Allow - то Known Bots - зеленая галочка 

Если Block - серая

У меня правила в Firewall rules расположены в таком порядке

1. Что жестко блокировать (Block - конкретные Usera Agents которые никак нельзя пропускать) 

2. Что Обязательно пропускать (первым Known Bots а дальше feedburner, pinterest, facebook и т.д.) 

3. Что пропускать через JS проверку ( все подозрительно и идущее через http/1.0 и 1.1, запросы к админке и т.п.)

ТО ЧТО ИДЕТ ВВЕРХУ ПО ПРАВИЛАМ CLOUDFLARE ПРИОРИТЕТНЕЕ К ВЫПОЛНЕНИЮ - то есть если вверху разрешить known bots а внизу логически запретить - то по общему правилу он разрешит.

У меня после подключения cloudflare, пришел отчет от директа, что сайт не доступен.

В WAF первым стоит правило Known Bots и добавлено исключение для mail.ru, для них - Allow.

Может после 24 февраля в cloudflare решили убрать яндексовских ботов из Known Bots?

Или бот директа блокируется с включенным режимом Bot Fight Mode?

Подскажите кто знает.

sochi-russia #:

)), нет, все гораздо проще

Как избавились?
Kostushko #:

Проверил свой список IP (xxx заменил на 0 и проверил ip в xseo.in) - 90% это сети мегафона, остальное мтс/йота и прочие провайдеры интернета. Полагаю мобильные операторы это простой способ получить дополнительный внешний ip для ботоводов. Метрика, скорее всего, их не сможет отсеять, так как с этих же ip наверняка иногда ходят и реальные посетители.

Вот тут https://vc.ru/seo/203524-nakrutki-povedencheskih-faktorov-put-v-top-ili-v-ban автор, вроде в теме, и он тоже пишет про нашествие ботов из сетей мегафона:

"Аномальный рост трафика из «паленых» подсетей. Настоящей легендой рунета за 2020-й стали прокси Metropolitan branch of OJSC MegaFon."

Так что похоже это очень старая "тема", живет минимум 3 года и решения у нее все еще нет. А если тема живет, значит скорее всего хоть частично работает (владельцам сайтов этой ветки в минус, ботоводам в плюс), остается надеяться что массовое использование возможно эту тему и добьет.

У меня аномальный рост ботов практически на всех сайтах начался в ноябре 2022, просмотрел многие темы про ботов, создал много тем про ботов, отправлял кучу примеров в Яндекс Вебмастер, Метрику, Роману из яндекса тут на сайте. Думал, тогда, что ботов вот-вот пофиксят и это какая то аномалия.

Но теперь придерживаюсь мнения, что спасение утопающих - дело рук самих утопающих! Яндекс эту проблему откровенно игнорирует, поэтому бороться с ботами на сайте должен сам вебмастер.

Тут много "персонажей" доказывают с пеной у рта, то, что с ботами никак бороться не нужно и на ранжирование вашего сайта прогревающие боты не влияют. Но это все сознательное введение в заблуждение, т.к после нагона ботов на сайт, за 1-2 недели позиции все в хлам улетают. Пишут они такое потому, что сами зарабатывают на накрутках.

Если хотя бы 50% вебмастеров начнут хоть как то бороться с ботами (прятать метрику, шифровать ее код, показывать только после определенных действий, блокировать спам по рефереру и тд), то работы у ботоводов в десятки раз прибавится.

Раз Яндекс на протяжении нескольких лет никак с ботами не боролся, то после реорганизации и подавно ничего делать не будут, им сейчас самое главное, что существующие сервисы работать не перестали (на мой субъективный взгляд, за последние пол года все у них стало работать через ж.пу, а как кинули клиентов из Яндекс телефонии, вообще отдельная тема). Так, что остается вебмастерам придумать более-менее универсальное решение, которое создаст дополнительную нагрузку накрутчикам, удорожая их работу.

Всего: 1959