Использующим серверный парсер Wordstat

12
natural born killer
На сайте с 06.10.2007
Offline
74
#11
сейчас же всё само получает-подставляет.

Потому-то и тему создал, что не получает оно куку. Оно втыкивает через ифрейм яваскриптом. Но с отключенным оным тоже не выбивает капчу. Щас покопаюсь

Блог Белого Негра (http://niggaslife.ru)
.:nbd:.
На сайте с 04.11.2008
Offline
98
#12

Там нужно гетом заслать разгаданную капчу и получить куку с http://kiks.yandex.ru/su/, иначе будет при каждом запросе отдавать капчу.

Палю тему Дорген (/ru/forum/439165) + кеи + контент (http://datarama.biz/) + еще немного кеев и скриптов (http://amazingsoftware.ru/) = $$$ Мы делаем доры, а не пишем романы (c) один Дима рефка dino_spomoni (http://goo.gl/w62v3)
banshee(oleg)
На сайте с 12.08.2007
Offline
140
#13


function GetWordstatCookie($keyword) {

// В этот файл будут записаны полученные куки
$user_cookie_file = 'temp/cookie.ch';

// Прикинемся браузером Firefox
$useragent="Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3 GTB7.0 YB/4.3.0";

$keyword = urlencode($keyword);
$url = "http://kiks.yandex.ru/su/";
$urlStat = "http://wordstat.yandex.ru/?cmd=words&page=1&text=".$keyword."&geo=&text_geo=";
$ch = curl_init($url);

// Header который мы отправляем Яндексу
$header = Array();
$header[] = 'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8';
$header[] = "Accept-Language: en-us,en;q=0.5";
$header[] = "Accept-Encoding: gzip,deflate";
$header[] = "Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7";
$header[] = "Keep-Alive: 115";
$header[] = "Connection: keep-alive";
$header[] = "Cache-Control: max-age=0";
$header[] = "Expires: Thu, 01 Jan 1970 00:00:01 GMT";

// Всякие переменные
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLINFO_HEADER_OUT, 1);
curl_setopt($ch, CURLOPT_USERAGENT, $useragent);
curl_setopt($ch, CURLOPT_HTTPHEADER, $header);
curl_setopt($ch, CURLOPT_COOKIEFILE, $user_cookie_file);
// Устанавливаем в какой файл будут записаны полученные куки
curl_setopt($ch, CURLOPT_COOKIEJAR, $user_cookie_file);

//Запрос страницы
$buffer = curl_exec($ch);

curl_close($ch);
}

Перед началом парсинга получаем куку в $user_cookie_file.

Дальше парсим, подключая её

		
curl_setopt($ch, CURLOPT_COOKIEFILE, "temp/cookie.ch");
N
На сайте с 04.03.2008
Offline
202
#14

может найдутся желающие поправить этот парсер /ru/forum/450632, а то перестал работать, а автор пропал, залил сюда http://narod.ru/disk/4225942001/eXlusive-psW-v1.0.1.zip.html

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий