Капча Яндекса, пути обхода

B
На сайте с 23.10.2006
Offline
170
#11
юни:
bimcom, XML не всегда отдаёт результаты на больших объёмах (после 500-600 запросов вылезает "ничего не найдено").

Пример запроса можно увидеть? после которого такая фигня?

У меня такое только иногда по ночам было.

юни
На сайте с 01.11.2005
Offline
924
#12

bimcom, пример вряд ли уже дам, но, поверьте, при единичном случае я не стал бы писать об этом - речь идёт о регулярно повторяющемся результате (возникающем при обработке миллионов запросов).

https://searchengines.guru/ru/forum/944108 - прокси-сервис на базе операторов домашнего интернета, сотни тысяч IP-адресов, канал от 20 Мбит
S2
На сайте с 07.01.2008
Offline
611
#13
юни:
Можно подробней?

Юни, раз я даже ссылки на прогу не дал, значит найти её элементарно просто)))

http://yandex.ru/yandsearch?text=%D0%BD%D0%B5%D0%B3%D1%80%D0%BE%D0%B8%D0%BC%D0%B8%D1%82%D0%B0%D1%82%D0%BE%D1%80&lr=213&stpar2=%2Fh1%2Ftm6%2Fs1&stpar4=%2Fs1&stpar1=%2Fu1&stpar3=%2Fm1%2Ftc13%2Fnc1

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
юни
На сайте с 01.11.2005
Offline
924
#14

Str256, ну, это тоже не совсем то... я не вижу способа достичь приемлимой скорости работы с этой программой, когда речь идёт о больших объёмах данных.

S2
На сайте с 07.01.2008
Offline
611
#15
юни:
Str256, ну, это тоже не совсем то... я не вижу способа достичь приемлимой скорости работы с этой программой, когда речь идёт о больших объёмах данных.

Вы ж об алгоритме спрашивали, программа это частность, вариант реализации. Можно ведь эмулировать 1000 браузеров с сотни IP.

юни
На сайте с 01.11.2005
Offline
924
#16
Str256:
Можно ведь эмулировать 1000 браузеров с сотни IP

Вот-вот. Здесь уже мощностей может не хватить.

Впрочем, с автором связался, спасибо.

fhuuz
На сайте с 08.03.2009
Offline
247
#17
Str256:
Вы ж об алгоритме спрашивали, программа это частность, вариант реализации. Можно ведь эмулировать 1000 браузеров с сотни IP.

Да как раз прога Кседант (многопоточная версия) может подойти.

На сайте автора есть видео, как он запускал несколько копий и поисковик (правда в примере был Гугл) воспринимал их как разные браузеры...

Тут есть видео

Zonk
На сайте с 19.05.2006
Offline
321
#18

Пока оптимальный вариант, который я вижу - проверять через XML и не найденные перепроверять через выдачу с сотен разных подсетей ip. Негроиммитатор для яндекса не поможет, т.к. и реальные пользователи постоянно видят капчу после нескольких запросов подряд с одного ip.

Б
На сайте с 30.06.2008
Offline
200
#19

А с распознаванием капчи всё уныло, ненадёжно и ресурсоёмко?

Будь мудрее. Выгляди глупее.
юни
На сайте с 01.11.2005
Offline
924
#20

Zonk, а с вордстатом как быть?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий