Сайты не мои.
Похоже, я накачал (через автоматический апдейт Windows) какие-то неудачные апдейты для MS IE.
Такое уже было когда-то, - после апдейта IE стал иногда неправильно показывать сайты.
Позвони им.
Когда они долго на мою заявку не отвечали, я позвонил, стали отвечать и приняли сайт в свою программу. Вопрос с деньгами я бы аналогично выяснял.
Категория "Бессмертие", - аффтар жжот. :-)
А как администрация AdSense относитс к таким "сайтам Web 2.0" с авто-контентом, сделанным с единственной целью показа рекламы AdSense?
Бывают проблемы с приёмом таких сайтов в систему или администрация ограничивается только формальными требованиями правил системы AdSense?
1-я десятка страниц - это 10x10=100.
Я пока пришёл к такому режиму:
1-я десятка страниц вытягивается со случайным интервалом 2-8 секунд.
Далее пауза около 1 минуты (иначе бан).
Потом так же все последующие десятки страниц - 2-8 секунд между страницами и по 60-70 секунд между десятками.
Выдача по запросу обработана - 5 минут (+ несколько ослучайных секунд) пауза - следующий запрос.
Если забанили - ввести код с картинки. Сразу может не пустить к выдаче по аналогичному запросу, тогда подождать несколько часов или окончания суток, - точно не измерял.
Легко, было бы желание. :-)
У тебя имена img совпадают с цифрами, - распознавалка капчи не понадобится.
Решение вполне разумное.
Google позволяет делать 1000 запросов в сутки, что для моих нужд должно быть вполне достаточно.
Яндекс в этом плане менее дружественный, но в принципе жить можно.
Я запомню этот вариант.
P.S.:
Новости с полей. 🚬
Google ловит на формате обращения к 1-й странице выдачи.
Что странно - он не ловит на другой вполне очевидной вещи - на реферере. Что, впрочем, легко и непринуждённо можно было бы обойти.
При достаточном случайном таймауте (больше 10 секунд) всё отдаётся нормально.
Только я ещё пока не работал с его параметром "filter", чтобы он более полные результаты показывал.
А Google API - не худший вариант. Возможно перейду на него.
Rambler при запросах к своей статистике (adstat.rambler.ru/wrds/) ловит то ли на частых запросах (одинаковый таймаут не обязателен), то ли на реферере, то ли на том и другом сразу. Я пока особо не разбирался, как с этим бороться, - не так важно.
Спасибо всем за советы.
Если кому интересно, напишу продолжение.
Не хватает раздела "Интернет-реклама".
А поймали меня, кстати, не на слишком частых запросах.
Было так: вытягиваю первую же страницу выдачи (запрашивал ссылки запросом "link:..."), и тут же получаю бан.
Дело в параметрах запроса. Адрес 1-й страницы выдачи при заходе по поиску имеет один вид, а при заходе на 1-ю страницу со 2-й адрес уже другой, - туда добавляются кое-какие параметры.
Я с адреса 2-го вида и зашёл сразу (так их в цикле проще перебирать) - и всё, залёт.