Парсинг выдачи гугла

12
KK
На сайте с 01.09.2005
Offline
0
KrK
1298

Пытаюсь парсить выдачу гугла, но он выдает разные страницы для браузера и скрипта. Разница небольшая: в выдаче для браузера присутствует такой код для каждого сайта в списке:

<p class=g><a href="http://www.brandmedia.ru/serv__idP_54.html" onmousedown="return clk(this.href,'res','2','')"><b>Дизайн</b> | Web-<b>дизайн</b> | Рекламный <b>Дизайн</b> | Полиграфия | Фирменный <b>...</b></a><br><font size=-1><b>Дизайн</b>, Web-<b>дизайн</b>, Рекламный <b>Дизайн</b>, Полиграфия, Фирменный стиль, логотипы,<br>

А для скрипта все тоже самое только нет:

onmousedown="return clk(this.href,'res','2','')"

А мне эта строчка нужна для определения позиции сайта, в данном случае, сайт на второй позиции.

Для парсинга использую функцию пхп:

$t=file_get_contents('http://www.google.ru/search?hl=ru&q='.urlencode($keyword).'&lr=lang_ru');

В чем здесь проблема?

A
На сайте с 02.06.2004
Offline
36
#1

попробуйте открывать CURL'ом, отдавая User-Agent какого-нибудь браузера

KK
На сайте с 01.09.2005
Offline
0
KrK
#2

А использование сокетов здесь никак помочь не может? Потому что CURL к сожалению нет на сервере, в котором будет использоваться скрипт, поэтому нужно попробовать обойтись стандартным набором функций

[Удален]
#3

Можно через сокеты делать, но тогда надо все http-заголовки вручную формировать.

Проще найти хостинг с поддержкой curl.

KK
На сайте с 01.09.2005
Offline
0
KrK
#4

проблема ушла. Нужно было отредактировать php.ini, изменив user-agent

WB
На сайте с 21.05.2004
Offline
36
#5

Регекспы рулят и все такое.

Andreyka
На сайте с 19.02.2005
Offline
822
#6
KrK:
Пытаюсь парсить выдачу гугла, но он выдает разные страницы для браузера и скрипта. Разница небольшая: в выдаче для браузера присутствует такой код для каждого сайта в списке:

Парсером не поделишся? Хочу где то найти такой и нигде не нахожу.

Не стоит плодить сущности без необходимости
UltraBait
На сайте с 10.05.2005
Offline
220
#7

И не найдешь. Иди к знакомому прогеру и заказывай :)

JK
На сайте с 29.07.2005
Offline
20
#8

Ничего сложного, я когда-то одному челу сделал парсинг рамблера и яндекса с возможностью выбора поисковика !

:no: :smoke: :eek:
WB
На сайте с 21.05.2004
Offline
36
#9

Обращайтесь ;) Хотя для Гугля, хоть для Яхи с МСНом

S
На сайте с 15.06.2005
Offline
76
#10

не проще юзать Google API?

я трогал интернет за яйца.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий