- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Задача такая:
-удалённо авторизоваться на странице page1
-парсить страницу page2, к которой доступ только залогиненным пользователям
-циклически парсить страницы page2.1, page2.2, ..., page 2.n, при чём делать это с перезагрузкой страницы парсера, то есть с выдачей информации на экран в процессе работы.
Правильно ли я понимаю, что технически для этого нужно?
-курлом или иным способом отправить post-запрос на page1 и получить cookie сессии
-с каждым следующим запросом к любой странице добавлять в заголовок эту cookie
Сами по себе все эти задачи я делать умею, но с сохранением сессии при парсинге ещё никогда не работал. Есть ли готовые примеры подобных парсеров или про что почитать?
Как то так, да, но потом на форуме появится очередной тред про кражу контента :-E
-с каждым следующим запросом к любой странице добавлять в заголовок эту cookie
http://php.net/manual/en/function.curl-setopt.php
CURLOPT_COOKIEFILE
CURLOPT_COOKIEJAR
Смею заверить, ко краже контента это не имеет никакого отношения. Просто удалённый мониторинг сайта.
Действительно, curl+cookies должно подойти, будем пробовать, спасибо за совет.