парсинг выдачи гугла

12
verhmax
На сайте с 01.12.2005
Offline
191
5773

добрый день. делаю тат скрипт анализатора позиций, восновном под себя, нужны некоторые нюансы и тд, никак не могу разобратся с парсингом гугла, постоянно какието траблы:( люди, подскажите где взять готовую функцию или код парсинга гугла. плиз!!!

SJ
На сайте с 16.03.2008
Offline
78
#1

А чем Agress Parser не угодил?

Любимый хостинг (http://beget.ru?id=2902) How can we grow old when the soundtrack of our lives is rock-n-roll?
A
На сайте с 16.08.2007
Offline
28
#2

На чем вы пишете-то хоть скажите ?:)

verhmax
На сайте с 01.12.2005
Offline
191
#3

на php :)

A
На сайте с 16.08.2007
Offline
28
#4
verhmax:
на php :)


$search_string="blabla";
$url_search="http://www.google.ru/search?q=".$search_string."&num=100";

$curl = curl_init();
$header[0] = "Accept: text/xml";
$header[0] .= "text/html;";
$header[] = "Cache-Control: max-age=0";
$header[] = "Connection: keep-alive";
$header[] = "Keep-Alive: 300";
$header[] = "Accept-Charset: windows-1251";
$header[] = "Accept-Language: ru-RU,ru;q=0.9,en-us,en;q=0.8";
$header[] = "Pragma: "; // browsers keep this blank.

curl_setopt($curl, CURLOPT_URL, $url_search);
curl_setopt($curl, CURLOPT_USERAGENT, 'User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727)');
curl_setopt($curl, CURLOPT_HTTPHEADER, $header);
curl_setopt($curl, CURLOPT_COOKIE,$cookie_string);


curl_setopt($curl, CURLOPT_REFERER, 'http://www.google.ru');
curl_setopt($curl, CURLOPT_HEADER,1);
curl_setopt($curl, CURLOPT_ENCODING, 'gzip,deflate');
curl_setopt($curl, CURLOPT_AUTOREFERER, true);
curl_setopt($curl, CURLOPT_PROXY, $proxy_ip);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_TIMEOUT, 20);

$html = curl_exec($curl); // execute the curl command
$info = curl_getinfo($curl);
curl_close($curl); // close the connection

preg_match_all('/<h3 class=r><a href="http:\/\/(\S*)"\s/',$html,$full_links);

Собственно основа... далее усложняйте в соответствие со своими задачами ;)

На сайте sitehistory.ru ежедневно ведется мониторинг позиций ваших сайтов, можете воспользоваться готовым решением ;)

verhmax
На сайте с 01.12.2005
Offline
191
#5

Fatal error: Call to undefined function curl_init()

PHP Version 5.2.4

extension=php_curl.dll - раскомментирован

пакет denwer-3 2008-01-13

с чем это может быть связано?

A
На сайте с 16.08.2007
Offline
28
#6

Скорей всего в php не установлена библиотека curl...

Создайте файл info.php с содержимым: <?php phpinfo(); ?>

И посмотрите есть ли в списке curl.

verhmax
На сайте с 01.12.2005
Offline
191
#7

arhong, нету. а как её туда установить?

Traffic
На сайте с 23.04.2008
Offline
71
#8

verhmax, качаете с php.net дистрибутив php под винду, там в папке extensions лежит файл php_curl.dll, его копируете в папку с расширениями php (где она там у денвера не знаю) и раскомментируете в php.ini строку extension=php_curl.dll

должно заработать :-)

TS
На сайте с 26.06.2008
Offline
36
#9
verhmax:
делаю тат скрипт анализатора позиций, восновном под себя, нужны некоторые нюансы и тд, никак не могу разобратся с парсингом гугла, постоянно какието траблы:( люди, подскажите где взять готовую функцию или код парсинга гугла. плиз!!!

Для начала посмотрите Сепарсер http://separser.ru

Какие именно нюансы вам нужны? Какие такие у вас хотелки? Озвучте плиз

ЗЫ гугл ваще редиска, вечно в серп пихает всякую фигню.

CenaMashin.ru (http://cenamashin.ru) - Сколько стоит твоя машина?
verhmax
На сайте с 01.12.2005
Offline
191
#10

TYUS, я хочу просто на функцию подать запрос и адрес сайта, в ответ хочу получить позицию

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий