Анти БОТ

Анти БОТ
Рейтинг
140
Регистрация
14.03.2020
Должность
специалист по поведенческим ботам

Анти БОТ (Сергей), какие тактические решения сейчас выбираете (я так понимаю, вы работаете с Killbot-ом) для понижения отказов (также не пускаете в Метрику с предварительно проверкой капчи)?

Кстати, как сейчас в KillBot-е выглядит реализация, сайт грузится без Метрики с капчей или что "условный пользователь" видит? 

Пользователь при входе на сайт видит вот такой кружочек. Левая часть - проверка всех параметров на стороне киллбот. Правые цифры в кружочке - это уже процесс загрузки самого сайта. Как только все подтянулось - сразу открывается сайт, уже полностью прогруженный. Т.е. все это крутится около 1-2 секунд, в основном, дальше сразу идет просмотр сайта.

antiddos24

Если система определила что это пользователь - просто открывается сайт.

Если в системе такой визит определяется как бот - появляется вот такая капча. Это основная, но есть и продвинутая, для тяжелых случаев, которая на данный момент в стандартной реализации антидетект браузеров не решается (это капча на уровне ОС, а не браузера).

Также на этом экране есть скрытое меню, которое любят жать боты, изображающие активность, в эту ловушку они часто попадают, ловя вечную капчу по кругу (это уже настраивается на уровне правил WAF).

В зависимости от настроек, можно боту показать метрику, а можно и скрыть. Т.е. бот грузит сайт без метрики (привет детским любителям огульно отключать метрику у себя на сайтах, мол не вижу значит этого нет).
Соответственно, при полноценной настройке, показатель роботности на сайте начинает стремиться к нулю. При сохранении статистики посещений по реальным пользователям.

antiddos24

юни #:
РТ в плане проводного интернета сложен в настройке, так что пока можно не пугаться. По крайней мере, по Москве и области. Там своя реализация IPoE и строгая авторизация, привязанная к железу. Сейчас нерентабельно его подключать на больших объёмах.

Года полтора-два назад весь инет был завален ботами Ростелеком Кранодар. В промышленных объемах. Потом они что-то подкрутили, и этот трафик сошёл на нет, объемы переместились в другие сети.

antiddos24


Сейчас тоже есть бот трафик с Ростелекома, но объемы да, уже не промышленные.

antiddos24

nash300 :
Такая проблема с версией 134 хрома, 5500 посетителей с начала октября 99% отказов, версия 140 - 38%, версия 141 - 31%.
Сейчас вроде 141 версия крайняя.
В настройках рандомизации в ботофермах могут быть прописаны разные версии браузера. А например кто на винде семерке остался, там последняя - 109 хром. Блоканете старые версии хрома - блоканете и их.

Т.е. версия в юзерагент почти ни о чем не говорит.  Можно конечно рассказывать сказки что у меня мол только с конкретным номером боты ходят, а остальные - хорошие. Но как правило это танцы с бубном и самоуспокоение. Нужно искать другие варианты фильтрации, а не по номеру версии блокировать.
Если китайские айпи, как вон по всем темам ластвариор пишет, то баньте китайские айпи. Если айпи например российские - то так уже не прокатит.
temniy #:
Они не умирают, они эволюционируют.

Имеется в виду что сгенерированный нейросетью текст для инфосайтов - намного качественнее чем чуть ранее сгенерированный рерайтерами, разбирающимися в теме как свинья в апельсинах?

Более краткий - да,  сам уже чаще спрашиваю у нейросети, чем у поиска. Но и здесь какая-то своя база должна быть, чтобы галлюцинации за чистую монету не принимать, переформулировать промпт, если видно что ответ мягко говоря не катит.

Да и по статистике, недавно попадалось по гуглу, - падает число поисковых запросов. И в итоге деградирует именно поиск и все что вокруг него кормилось. Включая сео (+ современное ответвление сео - накрутка поведенческими ботами, которое становится дороже), собственно то о чем в оглавлении топика идет речь. На которое завязано создание тонн бредотекста, с дальнейшей монетизацией всего этого через тот же РСЯ/адсенс. Как говорится, поставим этому всему - Дорожную.

По моему сайту. Постепенно в реферерах сайта начинает появляться тот же perplexity. Не так много, но в целом процесс уже идет, не заметить этого - невозможно. Ну а сколько просто не пришли (здесь отсылка к золотым временам эпохи СДЛ), так как ответ получили в самой нейронке - море. Благо лично у меня не инфосайт, цифры трафика не так важны, как и собственно наличие самого сайта.

Сейчас рекламой забита поисковая выдача, скоро, оглянуться не успеем, рекламой будут обвешаны ответы нейронок. Как только отгрызут достаточный процент рынка у поиска. Если пузырь ии раньше не схлопнется, тогда процесс внедрения монетизации ускорится. Не все же на деньгах инвесторов, с выпученными глазами, расти.

LikeAVirgin #:
Большинство людей некритичны, и это ничем не изменить.
А с этим кто-то спорит? Я же раньше написал, инфосайты еще до ИИ были забиты бредотекстом, рерайтом с рерайта. Так что то что они умирают, это вполне закономерный итог.
LikeAVirgin #:
Бред ИИ - это не из-за обучения на неверной информации, это - галлюцинации, т. е. иехническая особенность ИИ, которую на данный момент не исправить.
Вопрос в том, что эти галлюцинации воспринимаются за чистую монету. В итоге приходит человек, который уверен что 2+2=5, и его уже ничем не переубедить в том, что это не так. Для него ответ нейросети - это истина в высшей инстанции. 
Mik Foxi #:

да уже стало очень заметно на информационных вопросах, что ИИ отдают бредогенератор который нашли на дорвеях. 

На строительных темах, кстати, это очень явно заметно. Ищешь какую-то информацию, а в топе везде рерайт с рерайта, и рерайтом погоняет. Такой вылизанный выхолощенный общебред пишут, однотипный.

Причем на вопрос (условно, по аналогии) например сколько будет 2+2, сначала идет лекция на тему создания письменности, истории науки, видов систем исчислений, истории математики, теории относительности, общее описание вероятности, и проч, и только где-то среди всего этого сочинения на полтома войны и мира затесалась цифра 4, которую еще поискать надо, и не факт что она там есть.

А потом на этом же, стодвадцатьпятом поколении отрерайченгого рерайта, которого в общей массе источников например 99%, обучился ИИ. Ну и выдает то же, что и те дорвеи, с которых он это слизал.
Т.е. контент и до этого был убит, говнорерайтерами, а ИИ - это уже более продвинутое поколение рерайта с рерайта. Причем все это в ТОПе, плюс в быстрых ответах в поиске. Который, собственно, в процентах использования, уже теряет свои позиции в пользу нейросетей.

form777 #:
вот я на это и ответил

Это больше на выпук было похоже. У меня не информационный сайт, и не отрерайченный с рерайта. Так что играя в умного господина, дающего советы плебсам, сначала проверьте, там ли вы вообще нравоучениями занимаетесь.

form777 #:
нахер им ваши инфо сайты с отрерайченной
Это вы обращайтесь в соседнюю ветку, там где жалуются на то что яндекс снова обрезал выплаты по РСЯ. Разоблачайте там, ругайте, возвышайтесь.
Мне то это зачем пишете 🤣

В итоге нейросети обучаются на сгенерированной информации, следующие обучаются на сгенерированной из сгенерированной, и так далее.
Ксерокопия с ксерокопии, до этого сделанной с ксерокопии. В итоге, после определенного цикла ксерокопирований, получаем равномерно серый лист, на котором уже даже текста не видно.

Хуже всего в этом то, что люди становятся тупыми и слепо доверяются даже совсем ложной информации, но не способны при этом отличить правду от вымысла.

Всего: 1453