Парсер запароленных страниц

S
На сайте с 06.08.2007
Offline
14
1009

Пишу парсер на php, но страницы, которые надо парсить, закрыты паролем. Может кто в курсе как можно авторизоватся скриптом, и дальше спарсить что нужно?

Progr@mmer\.
На сайте с 14.10.2007
Offline
44
#1

Если авторизация посредством кукисов, то через cURL отправляйте логин/пароль логинирующему скрипту, он отдаёт в заголовках куки - вы их выцепляйте и берёте страницы через тот же cURL, но ещё отсылайте им куки для запрашивамых страниц. В принципе, всё очень просто.

cURL

Вашей девушке не хватает романтики? Черпните её на сайте «Я Люблю Романтику» (http://iloveromantics.ru/). Романтический форум (http://forum.iloveromantics.ru/) для отдыха от нудной работы.
K
На сайте с 12.07.2006
Offline
295
Kpd
#2

simolin, откройте страницу в браузере, посмотрите какие заголовки отправляются, потом в скрипте посылайте те же с помощью curl или сокетов.

rcdimon
На сайте с 05.05.2008
Offline
42
#3

как на PHP не знаю, не работал с ним, а вот с помощью LWP модуля для Perl это просто. Посмотрите на cpan.org подберите модуль.. что-то типа LWP::UserAgent или в этом роде, там же документация по использованию.

ЗЫ. Парсить перлом тоже проще ) Чего только стоит модуль HTML::Parser

VV
На сайте с 29.10.2006
Offline
64
#4

А на ASP нечто подобное возможно?

Brand from Amber
На сайте с 18.08.2007
Offline
293
#5
VINOGRADOV:
А на ASP нечто подобное возможно?

А почему нет? Копайте в сторону WinHttpRequest.

Лучший способ понять что-то самому - объяснить это другому.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий