Антоний Казанский

Антоний Казанский
Рейтинг
787
Регистрация
12.04.2007
Должность
Частный интернет-маркетолог и SEO специалист
Интересы
Интернет-маркетинг, SEO, интернет реклама
Подробности на сайте https://akazansky.ru
юни #:
Не понял этой фразы. Наверное, потому, что там нет пользователей и капча реже проходится?

Об этом я написал во второй части предложения, а в этой - я имел ввиду, что вручную часто блокируемые сети наверняка тоже рассматриваются как серые.


юни #:
Вообще, такой подход будет плохо работать на новых подсетях и/или типах трафика.

На новых - да, но свершенное действие - уже история, а историю можно (и в определённой степени) нужно анализировать.


юни #:
Думаю, что он анализируются не только по имеющейся истории, но и в реальном времени.

А вот это, пожалуй, самый интересный вопрос.

Какие данные собирает CF сервис после прохождения капчи - это действительно интересно. Никто не встречал разъяснительных материалов на эту тему?


юни #:
Как в антивирусах есть и база данных, и эвристика.

Не вижу повода не согласится, однако как уже сказал, пока пользователь не начал отправлять post данные, анализировать кроме формальных технических данных особо нечего. 

юни #:
Думаю, что сервисы капчи используют гораздо больше данных, чем просто информация из хуиза (частью которой является номер AS).

Я про это и говорю, что помимо фактических технических данных, которые доступны из протокола, сервисы типа CF используют свою историю (cвою аналитическую базу). И если в их базе большая часть заходов из отдельной AS имела большую часть отказов, то сервис помечает выбранную подсеть как серую и на старте направляет заходы из этой сети на капчу. Если процент прохождений капчи не растёт, то данная посеть так и остаётся в перечне серых.

Т.е. условная Битерика будет натыкаться на 100% капчу не потому, что мы про неё знаем из наших обсуждений на форуме, а потому что как раз пользователи сервиса её чаще всего блокируют и прохождение капчи там наверняка самый маленький процент.

А заходя с IP-шника домашнего провайдера CF знает про подсеть этого провайдера, что процент прохождения капчи там высокий, следовательно, нет необходимости каждый раз обрабатывать эти заходы через капчу.

Своего рода обучение, где белые подсети, а где серые.

Думаю, что скорее всего это работает так. Ибо логично и вполне резонно.

sagamorr #:
Если прошел, то он сохранится в метрике во внутреннем переходе (без ключа), накрутчику такой визит пользы не принесет.

Ммм.. смотрите.

Есть принципиально две различные стадии.

1) Стадия нагула - т.е. сбор куков и здесь накрутчику принципиально важно, чтобы был счётчик Яндекса.

Это могут быть прямые заходы, поисковые, реферальные.

Чаще всего прямые, потому что они избавляют от необходимости упираться в капчу Яндекса.

Поисковые конечно тоже используются, но позднее, когда профиль собран и уже необходимым образом "прогрет".

2) Стадия целевого захода, когда для эффективности накрутки важно использовать целевой поисковый запрос.

Вы сейчас про первое или про второе? 

юни #:
Очевидно, переходить к блокировке по другим признакам.

Хорошо, давайте поразмышляем, как это практически можно было применить.


юни #:
Т.е. от хуиза к анализу передаваемой информации (от заголовков, скриптов и прочих низкоуровневых данных и вплоть до поведения на сайте в целом).

Давайте с конца.

Поведение мы можем проанализировать лишь постфактум. Т.е. получив первую пачку get/post запросов мы можем анализировать лишь заголовки, выполнить js проверки - всё. 

Следовательно, на старте получив запрос от отдельного IP мы ничего не знаем про этого потенциального бота или пользователя.

СF, используя свою накопленную базу, может автоматически пропускать живого пользователя, а предположительного бота втыкать в капчу. Но это решение не на основе последующих данных, это решение на основе собранной статистики по отдельным случаям AS.

sagamorr #:
Возможно, что даже нет разницы прошел бот проверку или нет. Если не прошел, то он сохранится в метрике во внутреннем переходе (без ключа), накрутчику такой визит пользы не принесет.

Проверка выполняет до загрузки Метрики, поэтому если бот проверку не проходит, то он не попадает в Метрику и не получит куку Яндекса с этого сайта.

Вот одна любопытная деталь, я в группе накрутчиков спрашиваю,

группа почти 5K участников.

И знаете какой я сделал вывод из ответов? 

Большинство вслепую гоняют по сайтам готовыми программами и вообще многие слабо понимаю, что я такое спросил.

Из этого (и из моего первого сообщения) вывод - можно даже изначально показывать заглушку с самой просто капчей c отключенной Метрикой (на сомнительную подсеть) - боты будут бестолково ползать по заглушке. 

Большая часть "деятелей" банально тупо вслепую направляют ботов на выгул и отрабатывают на объёмы куков.

Вот, кстати, гайд, которые они любят друг другу перекидывать.  


sagamorr #:
Я понимаю, что домашний с прокси никак не связан, но теоретически ваша домашняя сеть может использоваться кем то для нагула профилей. Ее добавил владелец антибота в базу и теперь вам вылезает проверка.

Теоретически такое возможно, но года примерно полтора назад (может, больше, вас ещё не было на форуме) мы (и в частности я) - разбирали Антибот.

Я как раз приводил скриншоты и показывал, что Антибот просто отправляет всех на капчу и практические все участники обсуждения подтвердили, что - да, заходили под своими рабочими IP-шниками  и всем приходится разгадывать капчу.

При желании можно найти эту переписку, точно в ней участвовали Дима Алаев и Серафим, остальных сейчас не вспомню.


sagamorr #:
Можно не банить, а отправлять на проверку, если вы используете CF или что то подобное.

Ну вот и получается, что в итоге решает результат прохождения капчи, а не сервис. 

Впрочем, надо признать, что CF часть серверных проксей действительно жёстко банит (я с этим время от времени сталкиваюсь). 

sagamorr #:
Возможно ваша сетка "спалилась" и попала в базу.

Смотрите. Мой домашний IP-шник и мой рабочий компьютер он никак не связан с работой прокси - это отдельный компьютер. Вся работа с прокси идёт строго с другого компа, где другое железо и каждый рабочий вход начинает с процедуры проверки анонимности. Я провожу проверку под двум сервисам анонимности и если сгенерированная конфигурация не проходит проверку, последующие шаги невозможны (происходит это программно, поэтому человеческий фактор исключён).

Думаю, Антибот просто проверяет любого нового пользователя и перестраховывается капчей, вот и всё.

Но в этом случае мы просто может использовать капчу, как доп. проверку на роботность. 


sagamorr #:
Вот эта сеть AS25159 реально моб инет мегафона и сам попадал заходя с моб устройства на проверку. Но с нее помимо норм пользователей, еще куча ботов идет.

Вот о том и речь, что получается неразрешимая вилка, с одной стороны бот заходы с мобильных подсетей статистику и поведенческие, с другой стороны мы не можем банить эти точки входа, потому что оттуда возможен поток живых пользователей и клиентов. 

sagamorr #:

Т.е прокси сервер подменяет параметры сети? Через один прокси можно сделать 1000 разных визитов с 1000 разных AS?

Прокси подменяет ваши фактические параметры сети и показывает свои. Т.е. в определении конечного пользователя используют параметры прокси сервера, а не ваш оригинальные. В этом и есть смысл прокси сервера.

Что касается 1K визитов с 1K разных AS - скорее нет, чем да. 

Технические параметры определяет провайдер. Если он предоставляет доступ к огромной массе прокси ресурсов с разных AS, то у вас будут такие возможности, хотя говоря о тысячах AS я думаю для одного провайдера это маловероятно.

Посему, ваш рабочий стек будет зависит от того кол-во услуг, который вы будете использовать в своей работе. Вы же можете работать с большим кол-вом провайдеров, которые организуют доступ к прокси, поэтому чем шире охват, тем соответственно больше возможностей по AS.

Но как правило арендуют сотни проксей, где как правило десятки подсетей.

Есть более жирные тарифы на полторы тысячи проксей могут быть полторы сотни подсетей.

sagamorr #:

Можно спам сеткам выдавать капчу. Человек пройдет, а бот отвалится.

Я думаю на этом и построен весь антибот, просто большая база спам IP и AS.

Говоря об антиботе выше участвующего автора, он мне и на домашний IP показывает графическую капчу, хотя я естественно не занимаюсь нагулом со своего домашнего IP-шника, только и строго на проксях.

Всего: 12565