Парсинг результатов поисковиков

12
VT
На сайте с 27.01.2001
Offline
130
#11
Было дело - раз перебрал. Забанили на отметке более 200 запросов в час (точнее не знаю - статистики не вел). Потом из-за собственного баловства менял IP-ик у сервера.

Можно автоматически отлавливать новые анонимные прокси, которые Яндекс еще не знает, и ходить через них. Через каждые пару десятков запросов робот должен прокси менять, иначе их автомат может и засечь. :)

[R
На сайте с 12.03.2004
Offline
5
#12

euhenio,

А когда это было? И сколько всего запросов было послано (сколько часов)?

В конце прошлого года. Незадого до этого помню Я поголовно начал сканирование Инета.

Всего сколько запросов было не знаю - я примерно потом по трафику просчитал что не менее 200 за последний час до отключки. Запросы шли в течении двух дней. Не равномерно, но совершенно точно возрастая в количестве.

Автоматически не прощает, прийдется писать письмо и объясняться

Не знаю как сейчас - может и прощают всех подряд налево и направо.

Но вот тогда писал (и не одно) слезные послания с извинениями. В итоге оказалось проще и быстрее IP поменять.

[R
На сайте с 12.03.2004
Offline
5
#13

Vyacheslav Tikhonov,

Можно автоматически отлавливать новые анонимные прокси, которые Яндекс еще не знает, и ходить через них.

Ага, я до этого не додумался.

Вот только найти быстрый и при этом стабильный анонимный проксик - проблема.

Тогда я сделал скрипт-прокладку, равномерно раскидывающий запросы на несколько серверов (с разными IP) с тем же первоначальным скриптом. И переписывать практически ничего не пришлось.

"Лень - двигатель человека"

[Удален]
#14

Отличная вещь - иметь динамический IP для таких дел.

[R
На сайте с 12.03.2004
Offline
5
#15
Отличная вещь - иметь динамический IP для таких дел

Для домашних нужд да, но там и такой поток запросов не понадобится.

А для веб-сервера иметь динамический айпи проблематично.

Каширин
На сайте с 03.01.2004
Offline
1030
#16

А чем вам XML не угодил?

200 запросов в сутки хватает на многое

[R
На сайте с 12.03.2004
Offline
5
#17

Каширин,

Вообще на XML действительно более универсально получается. Правда, по началу у меня большие сомнения были, что выдача по XML и как обычно всегда совпадает.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий