Множественные (нулевые) переходы по внутренним страницам сайта: есть ли смысл бороться с ботами и парсерами?

Romanov Roman
На сайте с 21.06.2018
Offline
215
1374

Добрый день.

Ориентировочно, 2-3 недели назад, на одном из ресурсов, по данным Яндекс.Метрики, я заметил "скликивание" внутренних страниц сайта.

Ночью, в районе 3 часов, на сайт заходит гражданин "из Германии" и совершает множественные переходы, искажая тем самым статистические данные.

Примерно 3 визита в сутки. За 5-7 минут он может совершить 160-300 просмотров.

Скорее всего, мудозвон использует прокси. Возможно, что это бот, спамер, парсер, неудовлетворённый унылый мастурбатор.

IP-сеть: IPv4 address block not managed by the RIPE NCC.

Что я делал:

1. Включал логи сервера. Отслеживал ipv6 и ipv4. Блокировал их в файле .htaccess Wordpress.

Как Вы сами понимаете, "затвор (ip)" благополучно "передёргивали".

Решил забросить эту затею.

Друзья, помогите советом.

— Блокировать нахала по ip?

— Попробовать включить опцию в Яндекс.Метрике "Фильтровать роботов по строгим правилам и поведению"?

— Продолжать наполнение сайта, не обращая внимание на проблему?

— Какие последствия могут быть в результате такого нахальства? Может ли это негативно сказаться на ранжировании сайта?

* По данным Вебвизора, мышь перемещается. Переходы осуществляются в основном по пагинации сайта. Иногда злоумышленник что-то ищет, заходит на полную версию поста, и тогда "мышь замирает".

Всем удачи в продвижении сайтов. Будьте здоровы и счастливы, а остальное - "приложится".
G-and-Y
На сайте с 29.06.2013
Offline
185
#1

Один гражданин повлияет на весь сайт? Забей! Когда их будет 1000+ тогда можно начать переживать, и то...

Абузо-устойчивые впс ( http://vps-hosting.lv/?p=13408 )
fliger
На сайте с 17.09.2015
Offline
113
#2
Romanov Roman:
За 5-7 минут он может совершить 160-300 просмотров.

Нужно изначально ограничить возможность просматривания такого количества страниц за такое время (кроме нужных роботов) с блокированием IP.

Romanov Roman
На сайте с 21.06.2018
Offline
215
#3
fliger:
Нужно изначально ограничить возможность просматривания такого количества страниц за такое время (кроме нужных роботов) с блокированием IP.

Хостинг сообщил, что сервер настроен с 6 секундной задержкой. Если я правильно понимаю, это delay, косвенно защищающий от такого рода воздействия.

fliger
На сайте с 17.09.2015
Offline
113
#4

Через APC все делается. Каждому IP при первом заходе присваивается переменная = 1 на определенное время, потом при каждом заходе она увеличивается на 1. Когда достигает установленного предела - действие (блок, бан и т. д.).

Нужные роботы проверяются сначала по User-Agent, затем по имени хоста. Если фальшивый - сразу в бан. Если настоящий, присваивается переменная, которая при следующих заходах роботов сразу пропускает.

Romanov Roman
На сайте с 21.06.2018
Offline
215
#5

Интересная картина.

Хотелось бы услышать мнение тех, кто сталкивался с аналогичной ситуацией.

Робот/парсер/мудозвон, о котором я говорил, послан к чёртовой матери.

Решил немного передохнуть от писанины. От "нечего делать", зашёл в Вебвизор.

Бороться с данным явлением я не собираюсь.

Единственно, что мне интересно - это конечная цель того, о чём я сейчас расскажу.

Примерно 2 захода в сутки. В интервале от 3 до 4 утра по Москве. В течение двух месяцев и 2 года назад!

Все визиты прямые - с Гугла. Всегда сначала на "морду" сайта.

Затем, ВСЕГДА, используется форма поиска по сайту, в которую вводятся, в течение почти 2 месяцев, однотипные запросы:

https://site.ru/?s=стать умнее

https://site.ru/?s=красоту лица

И т.п.

Затем следуют нулевые заходы на посты и дальнейшее перемещение по пагинации:

https://site.ru/page/3?s=стать умнее

https://site.ru/page/3?s=красоту лица

В чём заключается конечная цель? Ведь слишком затянулись по времени такие визиты.

И терпение у человека "железное".

Mik Foxi
На сайте с 02.03.2011
Offline
1218
#6

Возможно мониторит человек определенные темы, интересен ему ваш сайт, зачем его банить?

Антибот, антиспам, веб фаервол, защита от накрутки поведенческих: https://antibot.cloud/ (8 лет на защите сайтов). Форум на замену серчу: https://foxi.biz/
Glueon
На сайте с 26.07.2013
Offline
172
#7

Возможно кто-то ПФ себе крутит и переобучает нейронку Яндекса на конкурентах. Чтобы боты были правильные, человечные, с нужным профилем.

Есть много IP-сетей в аренду под прокси, парсинг, рассылки (optin), vpn и хостинг. Телега: @contactroot ⚒ ContactRoot команда опытных сисадминов (/ru/forum/861038), свой LIR: сдаем в аренду сети IPv4/v6 (/ru/forum/1012475).
Химик78
На сайте с 16.10.2009
Offline
161
#8

Кто-то сайт парсит, цены мониторит, конкурентов анализирует, или сеошный анализатор на сайте статистику собирает и т.п. Вы еще серверный лог не смотрели, а только в метрику заглянули.

Что теперь из-за каждого из них нервы себе портить?

Забудьте про них и займитесь чем-нибудь по-настоящему полезным или приятным! :)

proshin.ru (http://proshin.ru/services/) - аудит сайтов, продвижение, контекстная реклама и пр.
Romanov Roman
На сайте с 21.06.2018
Offline
215
#9
Химик78:
Забудьте про них и займитесь чем-нибудь по-настоящему полезным или приятным!

Как приятно читать ответы, идущие из самого сердца.

Без единой толики лести, я хочу пожелать Вам удачи.

***

Пусть себе парсит, горемыка.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий