Как часто можно парсить выдачу яндекса?

ishipilov
На сайте с 25.12.2011
Offline
101
3215

собственно необходимо делать постоянные обращения к выдаче яндекса. Причем каждый день, каждый час, каждую минуту и желательно каждую секунду. XML не интересует, нужна живая выдача.

Вопрос к опытным дорвейщикам (знаю что многие дорвейщики парсят живую выдачу):

  • как часто можно парсить выдачу чтобы не было капчи и/или бана (скажем, 1 раз в 30 секунд)
  • при каких настройках это лучше делать (имею ввиду http-заголовки, использую curl)
  • что еще посоветуете?
Dos3
На сайте с 07.01.2011
Offline
363
#1

прокси и хоть каждую секунду парсь

без них, ну раз в 5-7, 7-9сек

ishipilov
На сайте с 25.12.2011
Offline
101
#2
Dos3:
без них, ну раз в 5-7, 7-9сек

а что по заголовкам? Какой User-Agent лучше использовать? Нужно ли включать кукисы? Или это все не важно?

donc
На сайте с 16.01.2007
Offline
686
#3

А чем ее заразу, нынче парсят, а то яшкалюб сдох? :(

Гугл парсит, а яндекс не хочет.

По моему опыту каптча вылезала если менее 15 сек.

В гугле ставлю примерно 19-22, каптча вылезает редко

Продвижение сайтов от 25 000 в мес, прозрачно, надежно https://searchengines.guru/ru/forum/818412 , но не быстро, отзывы
W
На сайте с 29.08.2009
Offline
97
#4
donc:

В гугле ставлю примерно 19-22, каптча вылезает редко

и сколько максимум в сутки с одного ИП можно обратиться к гуглу?

Dos3
На сайте с 07.01.2011
Offline
363
#5
ishipilov:
а что по заголовкам? Какой User-Agent лучше использовать? Нужно ли включать кукисы? Или это все не важно?

да несколько поставь агентов и хватит, у меня в доргене штук 400, но и с 1 всё тоже самое вроде))

куки включаю по привычке)

---------- Добавлено 19.09.2015 в 13:08 ----------

weboeb:
и сколько максимум в сутки с одного ИП можно обратиться к гуглу?

да докуя 😂

_Snake_
На сайте с 06.12.2010
Offline
151
#6
ishipilov:
Какой User-Agent лучше использовать?

Вот с этими парсь. Не банит вообще.


Mozilla/5.0 (Windows; U; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727)
Mozilla/5.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727)
Mozilla/5.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4325)
Mozilla/5.0 (compatible; MSIE 6.0; Windows NT 5.1)
Mozilla/45.0 (compatible; MSIE 6.0; Windows NT 5.1)
Mozilla/4.08 (compatible; MSIE 6.0; Windows NT 5.1)
Mozilla/4.01 (compatible; MSIE 6.0; Windows NT 5.1)
Mozilla/4.0 (X11; MSIE 6.0; i686; .NET CLR 1.1.4322; .NET CLR 2.0.50727; FDM)
Mozilla/4.0 (Windows; MSIE 6.0; Windows NT 6.0)
Mozilla/4.0 (Windows; MSIE 6.0; Windows NT 5.2)
Mozilla/4.0 (Windows; MSIE 6.0; Windows NT 5.0)
master_jeday
На сайте с 15.05.2010
Offline
231
#7

Раз в ~1 секунду паршу без всяких проксей со своего айпи. Иногда сутками. Банов не встречал ни разу. Каптч там вообще нету.

Дорвеи на заказ с гарантией трафика ( /ru/forum/993918 ) >>> Осторожно, в телеге/скайпе есть клоны! Проверяйте, что общаетесь именно со мной через личку!
P
На сайте с 28.01.2013
Offline
22
#8
master_jeday:
Раз в ~1 секунду паршу без всяких проксей со своего айпи. Иногда сутками. Банов не встречал ни разу. Каптч там вообще нету.

Живую выдачу яндекса?

twiprogon
На сайте с 22.07.2013
Offline
189
#9
master_jeday:
Каптч там вообще нету.

что то вы загоняетесь тут пацаны.. у яндекса и нет капчи при парсинге без задержки ?

LimonBucks.com (http://limonbucks.com) - Лучшие условия для конверта мобильного трафика
realefs
На сайте с 27.06.2010
Offline
87
#10
twiprogon:
что то вы загоняетесь тут пацаны.. у яндекса и нет капчи при парсинге без задержки ?

да, периодически с локальной машины дергаю выдачу без задержки, капчу дает 1-2 на 1к ключей (но это бывает только ночью и не постоянно). и бывают "критические" дни, на каждый ключ по 2-3 капчи вываливает.

Рубероид дорожает.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий