Нет, пока застрял на отправке капчи, не принимает он ее, хоть и код с картинки верный. Какие-то куки, скорее всего, не принимаю или не отправляю...
Вот только новая проблема - после отправки капчи Google возвращает следующее:
<HTML><HEAD> <meta http-equiv="content-type" content="text/html;charset=utf-8"> <TITLE>Redirecting</TITLE> <META HTTP-EQUIV="refresh" content="1; url=http://www.google.com/search?q=durov"> </HEAD> <BODY onLoad="location.replace('http://www.google.com/search?q\x3ddurov'+document.location.hash)"> Redirecting you to http://www.google.com/search?q=durov</BODY></HTML>
При обращении к этому адресу снова происходит редирект на капчу...
Очевидно дело именно в куки т.к. если настроить в браузере не принимать куки то при отправке формы с капчей наблюдается такое же поведение - он просто не принимает правильно введенную капчу и снова редиректит на google.com/sorry---------- Добавлено 17.10.2012 в 22:49 ----------Ура, получилось! Оказалось при загрузке картинки google вместе с ней передает куки и если их нет, то отправка капчи перестает работать. Достаточно загрузить саму картинку капчи и обработать заголовки которые вернул вместе с ней сервер.
Спасибо, настройка полезная окалазась. Выяснилось что куки при обращении на google.com/sorry не приходят:
HTTP/1.1 503 Service UnavailableDate: Wed, 17 Oct 2012 05:28:53 GMTPragma: no-cacheExpires: Fri, 01 Jan 1990 00:00:00 GMTCache-Control: no-cache, must-revalidateContent-Type: text/htmlServer: HTTP server (unknown)Content-Length: 2559X-XSS-Protection: 1; mode=blockX-Frame-Options: SAMEORIGIN<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"><html><head><meta http-equiv="content-type" content="text/html; charset=utf-8"><title>http://www.google.com/</title></head><body style="font-family: arial, sans-serif; background-color: £fff; color: £000; padding:20px; font-size:18px;" onload="e=document.getElementById('captcha');if(e)`e.focus();ñ"><div style="max-width:400px;"> <hr noshade size="1" style="color:£ccc; background-color:£ccc;"><br> To continue, please type the characters below:<br><br> <img src="/sorry/image?id=847023329088665422&hl=en" border="1" alt="Please enable images"><br><br><form action="Captcha" method="get"><input type="hidden" name="continue" value="http://www.google.com/"><input type="hidden" name="id" value="847023329088665422"><input type="text" name="captcha" value="" id="captcha" size="12" style="font-size:16px; padding:3px 0 3px 5px; margin-left:0px;"><input type="submit" name="submit" value="Submit" style="font-size:18px; padding:4px 0;"><br><br><br></form> <hr noshade size="1" style="color:£ccc; background-color:£ccc;"> <div style="font-size:13px;"> <b>About this page</b><br><br>Our systems have detected unusual traffic from your computer network. This page checks to see if it&£39;s really you sending the requests, and not a robot. <a href="£" onclick="document.getElementById('infoDiv').style.display='block';">Why did this happen?</a><br><br> <div id="infoDiv" style="display:none; background-color:£eee; padding:10px; margin:0 0 15px 0; line-height:1.4em;"> This page appears when Google automatically detects requests coming from your computer network which appear to be in violation of the <a href="http://www.google.com/accounts/TOS">Terms of Service</a>. The block will expire shortly after those requests stop. In the meantime, solving the above CAPTCHA will let you continue to use our services.<br><br>This traffic may have been sent by malicious software, a browser plug-in, or a script that sends automated requests. If you share your network connection, ask your administrator for help — a different computer using the same IP address may be responsible. <a href="http://www.google.com/support/bin/answer.py?answer=86640">Learn more</a><br><br>Sometimes you may be asked to solve the CAPTCHA if you are using advanced terms that robots are known to use, or sending requests very quickly. </div> IP address: 94.243.223.233<br>Time: 2012-10-17T05:28:53Z<br>URL: http://www.google.com/<br> </div></div></body></html>
Через браузер тоже самое:
HTTP/1.1 503 Service UnavailableDate: Wed, 17 Oct 2012 05:31:02 GMTPragma: no-cacheExpires: Fri, 01 Jan 1990 00:00:00 GMTCache-Control: no-cache, must-revalidateContent-Type: text/htmlServer: HTTP server (unknown)Content-Length: 2561X-XSS-Protection: 1; mode=blockX-Frame-Options: SAMEORIGIN
Но! В браузере при обращении к google.com/sorry уже уходят куки:
GET /sorry/ HTTP/1.1Host: google.comConnection: keep-aliveUser-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_2) AppleWebKit/537.4 (KHTML, like Gecko) Chrome/22.0.1229.94 Safari/537.4Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8Accept-Encoding: gzip,deflate,sdchAccept-Language: en-US,en;q=0.8Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.3Cookie: PREF=ID=dd5a27d6d3298b2a:U=88a3f3a449a081cf:FF=0:TM=1350406367:LM=1350412342:S=poWyfWZeZSEGwbrC; NID=64=d4IY9kkz2ANrj88kyPUKAlpKmf2vrUQ8tcMGO6nXC066NK4zgsZufLiD7nsNeg8zEqbmVTAyHGUJpKuJkzBZRconTRgKAF87zYYnh18ywGeV8zNum9ktFkvqT5ETc2rJ; GDSESS=ID=81d845b8131a7f2b:TM=1350451505:C=c:IP=94.243.223.233-:S=ADSvE-c5vFvS1QbJ02kFNQMiyj1kS-fm9g; GMAIL_RTT=684
И это при том, что я сижу через incognito window в Chrome. Откуда они берутся??
Пробовал. Открыл google.com/sorry, нашел ID каптчи. Для чистоты закрыл эту вкладку, открыл пустую и просто вставил сформированный запрос:
Результат - нормальная главная страница Google. Уже попробовал и ручной ввод текста с капчи, вместо antigate, но все равно та же ситуация.
Тоже самое. Не думаю что дело в самом парсинге картинки с капчей, в опр. момент я делал проверку и смотрел что в сохраненной картинке и что приходило с antigate, код с капчи приходил верный.
Сравнивал, вот для примера запрос на отправку:
Request URL:http://google.com/sorry/Captcha?id=18065568466225803985&captcha=dedect&submit=Submit Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Charset:ISO-8859-1,utf-8;q=0.7,*;q=0.3 Accept-Encoding:gzip,deflate,sdch Accept-Language:en-US,en;q=0.8 Connection:keep-alive Cookie:GMAIL_RTT=18; GDSESS=ID=f3336de59869985c:TM=1350406255:C=c:IP=94.243.223.233-:S=ADSvE-du0efaimiFZkufk7bY1kyklifLNw Host:google.com User-Agent:Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_2) AppleWebKit/537.4 (KHTML, like Gecko) Chrome/22.0.1229.94 Safari/537.4
А вот ответ:
Ну там же указано в теге формы method="get". Да и через developer tools в браузере проверил, там действительно get-запрос.
По сути это старый кусок кода. Убрал чтобы не смущать народ ))
Поменял на
curl_setopt($curl,CURLOPT_URL,'http://www.google.com/sorry/Captcha?continue='.urlencode('http://www.google.com/').'&id='.$captcha_id.'&captcha='.$text.'&submit=Submit');
Но тоже самое, http 503 и страница с капчей.