- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта
Применяем отклонение ссылок
Сервис Rookee
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Ну там же указано в теге формы method="get". Да и через developer tools в браузере проверил, там действительно get-запрос.
Ну значит что-то упустили.
Через FireBug проверяли запрос и ответ вручную? Сравнивали с вашим?
Ну значит что-то упустили.
Через FireBug проверяли запрос и ответ вручную? Сравнивали с вашим?
Сравнивал, вот для примера запрос на отправку:
А вот ответ:
Cache-Control:no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Content-Length:322
Content-Type:text/html; charset=UTF-8
Date:Tue, 16 Oct 2012 16:52:47 GMT
Expires:Tue, 16 Oct 2012 16:52:47 GMT
Location:http://www.google.com/
Pragma:no-cache
Server:HTTP server (unknown)
Set-Cookie:GDSESS=ID=f3336de59869985c:TM=1350406255:C=c:IP=94.243.223.233-:S=ADSvE-ec0sbPLNb3DmSSczVvEaEXwg2DNg; path=/; domain=google.com; expires=Tue, 16-Oct-2012 19:50:55 GMT
X-Frame-Options:SAMEORIGIN
X-XSS-Protection:1; mode=block
А так:
curl_setopt($curl,CURLOPT_URL,'http://google.com/sorry/');
curl_setopt($curl,CURLOPT_RETURNTRANSFER,true);
curl_setopt($curl,CURLOPT_CONNECTTIMEOUT,5);
curl_setopt($curl,CURLOPT_HEADER,1);
curl_setopt($curl,CURLOPT_FOLLOWLOCATION, true);
curl_setopt($curl,CURLOPT_TIMEOUT,10);
curl_setopt($curl, CURLOPT_COOKIEFILE, '/tmp/cookie.txt');
curl_setopt($curl, CURLOPT_COOKIEJAR, '/tmp/cookie.txt');
curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US; rv:1.9.0.3) Gecko/2008092417 Firefox/3.0.3');
curl_setopt($curl, CURLOPT_REFERER, 'http://www.google.com/');
curl_setopt($curl,CURLOPT_ENCODING,"gzip,deflate");
$response = curl_exec($curl);
//detecting captcha image path
preg_match("/<img src=\"(.*)\" border/", $response, $matches);
$img_path = 'http://www.google.com' . $matches[1];
preg_match("/id=(.*)&/", $matches[1] $matches2);
$captcha_id = $matches2[1];
//saving captcha image
file_put_contents('/tmp/'.$captcha_id.'.jpg', file_get_contents($img_path));
//sending captcha to Antigate
$text = Antigate::recognize(....);
//building url for submitting captcha
curl_setopt($curl,CURLOPT_URL,'http://www.google.com/sorry/Captcha?continue='.urlencode('http://www.google.com/').'&id='.$captcha_id.'&captcha='.$text.'&submit=Submit');
curl_setopt($curl,CURLOPT_RETURNTRANSFER,true);
curl_setopt($curl,CURLOPT_HEADER,false);
curl_setopt($curl,CURLOPT_FOLLOWLOCATION, true);
curl_setopt($curl, CURLOPT_COOKIEFILE, '/tmp/cookie.txt');
curl_setopt($curl, CURLOPT_COOKIEJAR, '/tmp/cookie.txt');
$http_headers = array(
'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
'Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.3',
'Accept-Encoding: gzip,deflate,sdch',
'Accept-Language: en-US,en;q=0.8',
'Connection: keep-alive',
'Host: google.com',
'Referer: http://google.com/sorry/',
'User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_2) AppleWebKit/537.4 (KHTML, like Gecko) Chrome/22.0.1229.94 Safari/537.4'
);
curl_setopt($curl, CURLOPT_HTTPHEADER, $http_headers);
$response = curl_exec($curl);
echo $response;
?
А так:
?
Тоже самое. Не думаю что дело в самом парсинге картинки с капчей, в опр. момент я делал проверку и смотрел что в сохраненной картинке и что приходило с antigate, код с капчи приходил верный.
Тоже самое. Не думаю что дело в самом парсинге картинки с капчей, в опр. момент я делал проверку и смотрел что в сохраненной картинке и что приходило с antigate, код с капчи приходил верный.
Откройте браузер + инструмент для просмотра HTTP заголовков и вручную отправьте данные с картинки. Проверьте все ли необходимые параметры передаются.
Откройте браузер + инструмент для просмотра HTTP заголовков и вручную отправьте данные с картинки. Проверьте все ли необходимые параметры передаются.
Пробовал. Открыл google.com/sorry, нашел ID каптчи. Для чистоты закрыл эту вкладку, открыл пустую и просто вставил сформированный запрос:
Результат - нормальная главная страница Google. Уже попробовал и ручной ввод текста с капчи, вместо antigate, но все равно та же ситуация.
Попробуйте добавить в оба запроса два, указанных ниже параметра и покажите вывод переменной $response для обоих.
Добавить:
curl_setopt($curl, CURLOPT_HEADER, 1);
curl_setopt($curl, CURLINFO_HEADER_OUT, 1);
Попробуйте добавить в оба запроса два, указанных ниже параметра и покажите вывод переменной $response для обоих.
Добавить:
curl_setopt($curl, CURLOPT_HEADER, 1);
curl_setopt($curl, CURLINFO_HEADER_OUT, 1);
Спасибо, настройка полезная окалазась. Выяснилось что куки при обращении на google.com/sorry не приходят:
Через браузер тоже самое:
Но! В браузере при обращении к google.com/sorry уже уходят куки:
И это при том, что я сижу через incognito window в Chrome. Откуда они берутся??
Очевидно дело именно в куки т.к. если настроить в браузере не принимать куки то при отправке формы с капчей наблюдается такое же поведение - он просто не принимает правильно введенную капчу и снова редиректит на google.com/sorry
---------- Добавлено 17.10.2012 в 22:49 ----------
Ура, получилось! Оказалось при загрузке картинки google вместе с ней передает куки и если их нет, то отправка капчи перестает работать. Достаточно загрузить саму картинку капчи и обработать заголовки которые вернул вместе с ней сервер.
Вот только новая проблема - после отправки капчи Google возвращает следующее:
При обращении к этому адресу снова происходит редирект на капчу...