Результаты поиска Google программно

metton · 2006-11-08T19:02:42.0000000Z

Собственно, вопрос: как из программы получить результаты поиска гугла? При тупом скачивании страницы perl-ом Google выдаёт какую-то непотребщину... Подкиньте ссылки на темы где это обсуждалось или ссылки на ресурсы, где об этом написано.

46

!kt0

8 ноября 2006, 20:29

#11

niklab:
гугл лучше парсить вот так:
http://www.google.com/ie?q=test&num=100&hl=en

+ гугл не банит ip ( по крайней мере я 5 милионов запросов пробил так без остановки скрипта)
+ трафик расходуеться экономнее

Очень повезло. Обычно 5-10 минут.

filter=0 забыл

http://seorepa.com/ (http://seorepa.com/) - блог был там, пока не запилили mchost

386

dkameleon

8 ноября 2006, 20:40

#12

metton:
Укажи на что конкретно обратить внимание.

на редиректы

Дизайн интерьера (http://balabukha.com/)

B

39

benzole

9 ноября 2006, 07:59

#13

metton:
benzole
А подробнее? какими инструментами (модулями) пользуетесь?
Для гугли совершенно фиолетово что я юзаю: perl или php. Идёт определение того, что я не броузер и посылание нафих (насколько я понимаю). Так вот как бы замаскироваться под броузер? :-)

ну дык собственно это курл (библиотека для php если что) и делает. создаёт этакий виртуальный браузер, с юзерагентами, куками и т.д. В гугле оч.много примеров кода, и использованием списка прокси тоже есть.

П

104

Пилот

9 ноября 2006, 12:18

#14

перлом парсил выдачу и ни кких проблем, все нормально отдавал

Вечные ссылки в рассрочку, отобраны только качественные доноры Регистрация по приглашению -> http://gogettop.ru/?ref=18973 (http://gogettop.ru/?ref=18973)

[Удален]

9 ноября 2006, 19:25

#15

Странно, при попытке программно слизать результат что на рабочем инете, что со стрима, выдаёт HTML-ную страничку: "We have encountered an error while processing your request. If you would like to provide us with information..."

K

90

Karmaro

10 ноября 2006, 00:05

#16

проблема или в редиректе, или в том, что google отдавал GZIP пожатые файлы.

если уж очень хочется вытаскивать php скриптом через WWW данные, то можно сделать так:


require_once "PEAR.php";        

require_once 'Net/Socket.php';  

require_once 'HTTP/Request.php';

$req =& new HTTP_Request('http://www.google.ru', array('allowRedirects'=>true));

if (!PEAR::isError($req->sendRequest())) {

$sContent = $req->getResponseBody();

}

подробнее - см. доки на PEAR

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

П

104

Пилот

10 ноября 2006, 08:49

#17

в перле это делал так и все работало


$l="http://www.google.com/search?q=test&hl=en&lr=&start=0&sa=N";

$ua = LWP::UserAgent->new(env_proxy => 1,

                                       keep_alive => 1,

                                       timeout => 60,

                                       agent => "Mozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt)"

                                      );

    $ua->env_proxy;

    $ua->no_proxy('localhost'); 

    $req = $ua->get($l);

    $file= $req->content;

    print $file;

28

Loofort

11 ноября 2006, 13:13

#18

Удивлён, что никто не вспомнил про класс Snoopy в php. Имитирует браузер, ( использует Curl)

SEO-Сервис по проверке индекса Google (http://seo4site.com/tools/index-checker/) пасрать тут (blog) (http://blog.seo4site.com/)

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта

Курс биткоина превысил $50 тысяч