Хорошо, давайте поразмышляем, как это практически можно было применить.
Давайте с конца.
Поведение мы можем проанализировать лишь постфактум. Т.е. получив первую пачку get/post запросов мы можем анализировать лишь заголовки, выполнить js проверки - всё.
Следовательно, на старте получив запрос от отдельного IP мы ничего не знаем про этого потенциального бота или пользователя.
СF, используя свою накопленную базу, может автоматически пропускать живого пользователя, а предположительного бота втыкать в капчу. Но это решение не на основе последующих данных, это решение на основе собранной статистики по отдельным случаям AS.
Проверка выполняет до загрузки Метрики, поэтому если бот проверку не проходит, то он не попадает в Метрику и не получит куку Яндекса с этого сайта.
Вот одна любопытная деталь, я в группе накрутчиков спрашиваю,
группа почти 5K участников.
И знаете какой я сделал вывод из ответов?
Большинство вслепую гоняют по сайтам готовыми программами и вообще многие слабо понимаю, что я такое спросил.
Из этого (и из моего первого сообщения) вывод - можно даже изначально показывать заглушку с самой просто капчей c отключенной Метрикой (на сомнительную подсеть) - боты будут бестолково ползать по заглушке.
Большая часть "деятелей" банально тупо вслепую направляют ботов на выгул и отрабатывают на объёмы куков.
Вот, кстати, гайд, которые они любят друг другу перекидывать.
Теоретически такое возможно, но года примерно полтора назад (может, больше, вас ещё не было на форуме) мы (и в частности я) - разбирали Антибот.
Я как раз приводил скриншоты и показывал, что Антибот просто отправляет всех на капчу и практические все участники обсуждения подтвердили, что - да, заходили под своими рабочими IP-шниками и всем приходится разгадывать капчу.
При желании можно найти эту переписку, точно в ней участвовали Дима Алаев и Серафим, остальных сейчас не вспомню.
Ну вот и получается, что в итоге решает результат прохождения капчи, а не сервис.
Впрочем, надо признать, что CF часть серверных проксей действительно жёстко банит (я с этим время от времени сталкиваюсь).
Смотрите. Мой домашний IP-шник и мой рабочий компьютер он никак не связан с работой прокси - это отдельный компьютер. Вся работа с прокси идёт строго с другого компа, где другое железо и каждый рабочий вход начинает с процедуры проверки анонимности. Я провожу проверку под двум сервисам анонимности и если сгенерированная конфигурация не проходит проверку, последующие шаги невозможны (происходит это программно, поэтому человеческий фактор исключён).
Думаю, Антибот просто проверяет любого нового пользователя и перестраховывается капчей, вот и всё.
Но в этом случае мы просто может использовать капчу, как доп. проверку на роботность.
Вот о том и речь, что получается неразрешимая вилка, с одной стороны бот заходы с мобильных подсетей статистику и поведенческие, с другой стороны мы не можем банить эти точки входа, потому что оттуда возможен поток живых пользователей и клиентов.
Т.е прокси сервер подменяет параметры сети? Через один прокси можно сделать 1000 разных визитов с 1000 разных AS?
Прокси подменяет ваши фактические параметры сети и показывает свои. Т.е. в определении конечного пользователя используют параметры прокси сервера, а не ваш оригинальные. В этом и есть смысл прокси сервера.
Что касается 1K визитов с 1K разных AS - скорее нет, чем да.
Технические параметры определяет провайдер. Если он предоставляет доступ к огромной массе прокси ресурсов с разных AS, то у вас будут такие возможности, хотя говоря о тысячах AS я думаю для одного провайдера это маловероятно.
Посему, ваш рабочий стек будет зависит от того кол-во услуг, который вы будете использовать в своей работе. Вы же можете работать с большим кол-вом провайдеров, которые организуют доступ к прокси, поэтому чем шире охват, тем соответственно больше возможностей по AS.
Но как правило арендуют сотни проксей, где как правило десятки подсетей.
Есть более жирные тарифы на полторы тысячи проксей могут быть полторы сотни подсетей.
Можно спам сеткам выдавать капчу. Человек пройдет, а бот отвалится.
Я думаю на этом и построен весь антибот, просто большая база спам IP и AS.
Говоря об антиботе выше участвующего автора, он мне и на домашний IP показывает графическую капчу, хотя я естественно не занимаюсь нагулом со своего домашнего IP-шника, только и строго на проксях.
Фактически конечный вебмастер видит заход с конкретным IP и с характеристикой сети.
Если это Битерика - здесь можно смело банить, а если это домашний провайдер с которого возможны живые переходы, что делать с ним? И таких адресов может быть тысячи. Что даст понимание иерархии?
Вот к сожалению на этом условии и сыпется идея блокировки поведенческих ботов.
Иногда, особо ушлые вебмастера вместо счётчиков вставляют картинку счётчика :)
Укажите сайт, посмотрим.