Капча Google - проблема

ST
На сайте с 12.05.2007
Offline
96
1291

Продолжаю неспешно писать парсер выдачи Google (PHP + curl), ну и конечно периодически натыкаюсь на капчу.

Что бы хотелось - скрипт парсит выдачу, как только появляется капча, скрипт тормозится, показывает капчу и ждет пока пользователь введет её, после ввода капчи продолжает работу.

Что имеем - картинка (капча) обновляется каждый раз как к ней обращаешься, в итоге curl получает страницу sorry.google.ru с капчей, регулярками выдирает url капчи и дальше 2 варианта: либо сохранить картинку себе и показать пользователю капчу уже со своего сервера, либо показывать напрямую с сервера google. В обоих вариантах идет повторное обращение к капче и код на ней уже другой соответственно.

Как быть?

P.S. Про proxy и API знаю.

SmarT.SPB добавил 13.04.2011 в 22:46

Ап :(

10 апов

ST
На сайте с 12.05.2007
Offline
96
#1

Так и не разобрался, может быть будут хоть какие-нибудь идеи? Или это не возможно?

Дмитрий
На сайте с 23.08.2006
Offline
222
#2

Вы, после выдирания капчи с sorry.google.ru получаете ее содержимое? Если нет, то теоретически должно работать нормально. Возможно там защита - капча, которую затем можно успешно вбить, отдается только в в рамках одного соединения (keep alive). Тогда отошлите гуглу заголовок о том что поддерживаете keep-alive и не делайте curl_close.

Разрабатываю и автоматизирую на php http://jonnyb.ru/

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий