Капча Яндекса, пути обхода

юни
На сайте с 01.11.2005
Offline
933
#91
CatRegist:
чем пытаться создать ботов с поведение, аналогичным людям?

Дык, а тут сложного-то ничего нет особо. Зашёл "с закладок", "набрал" запрос, по в меру рандомным таймаутам полистал выдачу, вышел по рандомной ссылке, с упором на первые страницы. Листание, заходы и выходы - решаются редиректами по рефереру.

Собсна, всё. :)

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
CR
На сайте с 29.10.2005
Offline
198
#92
юни:
Дык, а тут сложного-то ничего нет особо.

Яндекс чтит 16% пользователей или сколько там из интервью?, которые пользуются им постоянно. Соответственно нужен супер бот, который будет юзать почту, проверять пробки на дорогах, юзать маркет и т.п. Разумеется ИМХО, но Яндекс не настолько примитивен, что бы ставить параметром рулевантности любой IP.

Забыл добавить, что у них есть также статистика, которой не обладаем мы, по портрету человекопользователя.. не думаю что простым рандомом задержек и кликов получится эмитировать хомосапиенс.

С Уважением, Евгений
юни
На сайте с 01.11.2005
Offline
933
#93
CatRegist:
Яндекс чтит 16% пользователей или сколько там из интервью?

А ссылка есть? Что-то мимо меня прошло.

CatRegist:
Соответственно нужен супер бот, который будет юзать почту, проверять пробки на дорогах, юзать маркет и т.п.

Ну, это вряд ли... можно, конечно, понаделать логинов в Яндексе и ходить через них, но это избыточно. Не весь же Рунет в обязательном порядке имеет у них логин.

CatRegist:
Забыл добавить, что у них есть также статистика, которой не обладаем мы, по портрету человекопользователя..

Дык, а с чего он рисуется, кроме как с куков и общей картины, создаваемой кликами по ссылкам, которые обрабатываются скриптами?

(Кстати, суровая статистика, которую действительно трудно подделать (уже сталкивались на практике), реализована в Директе. Вот там да, учитвается много параметров по каждому клику, и для их грамотной накрутки нужны существенные мощности и алгоритмы (т.е., говоря грубо, на 10 кликов - 100 заходов, 1000 ip и определённая схема соотношений показов/кликов, не говоря о технической части, навроде куков, хидеров, географии ip, работы с редиректами после клика на рекламе и пр.). Тоже самое в Гугл Аналитикс, кстати.)

А для анализа всего ежедневного массива хостов - попросту мощностей не хватит. Опять же, ну появится в общей картине на 100 млн. заходов в сутки, новые 100.000, которые чем-то отличаются от остальных. Куда их отнести? А если их будет 10 млн.?

Это ведь не сложно технически реализовать.

CR
На сайте с 29.10.2005
Offline
198
#94
юни:
А ссылка есть? Что-то мимо меня прошло.
Четвертый факт: все пользователи равны, но не все одинаково активны. 18% самых активных любимых нами пользователей задают в 100 раз больше запросов.

/ru/news/83

Всетаки не так в голове у меня это отложилось, бывает =( Суть тут конечно же другая. А по поводу:

юни:
Вот там да, учитвается много параметров по каждому клику
юни:
определённая схема соотношений показов/кликов

Все это есть в выдаче и можно сказать официально Яндексом признано. А показы и клики вообще можно посмотреть в панеле вебмастера =) В целом у вадачи и директа остается не так много различий..

Об защите и нападении тему мусолить можно вечно =) но пока войны ещё не началось истину найти не удастся.

юни
На сайте с 01.11.2005
Offline
933
#95
CatRegist:
но пока войны ещё не началось

Ну, не то, что бы... судя по постоянно открывающимся сервисам, количество сео-трафика будет только возрастать. Другое дело, что пока ему противодействуют только на уровне отсева явно не пользовательских запросов и ограничений по ip, т.е. наращиванием мощностей пока удаётся решить проблему.

Но и вопрос использования накопленной статистики по полной (с составлением портретов пользователя и пр.) тоже под большим вопросом, для меня, по крайней мере. В конце концов, можно решить задачу менее затратным способом.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий