- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Отслеживаю информацию на нескольких сайтах. Написал простенького робота на curl, натравил на каждый сайт.
Трафик достаточно неслабый получается, поэтому возникло желание немного сэкономить: один из сайтов отдает правильные заголовки ( ETag, Last-Modified и т.п. - всё в соответствии со статьей h**p://xpoint.ru/know-how/Articles/SlezhenieZaKontentom )
Использую стандартный кусок кода, который сохраняет страницу в файл, что-то вроде:
function curlurl ($ url1) {
$curl = curl_init( );
$fp = fopen("somefile.txt", "w");
curl_setopt ($curl, CURLOPT_URL, $url1");
curl_setopt($curl, CURLOPT_FILE, $fp);
curl_exec ($curl);
curl_close ($curl);
}
Подскажите, где найти пример более "тонкой" работы с curl для того, чтобы не скачивать страницы, которые не изменились с последнего захода или хотя бы в какую сторону смотреть и искать.
Разобрался сам.
curl_setopt($curl, CURLOPT_NOBODY, 1);
curl_setopt($curl, CURLOPT_HEADER, 1);
Далее парсить заголовки.