Проблема с парсингом Яндекса, помогите!

12
RT
На сайте с 08.11.2006
Offline
1
1246

Как избежать бана со стороны Яндекса при парсинге на предмет сбора статистики по позициям?

Задача: ежедневно, в автоматическом режиме собирать статистику положения запросов в Яндексе по большому количеству сайтов.

Сбор статистики через XML не подходит из-за ограничения количества запросов. Платный XML не подходит по причине недостатка бюджета.

MiRaj
На сайте с 03.07.2006
Offline
509
#1

ROST,

1) желательно иметь русский IP

2) представляйте user-agent-а как браузер (IE, Opera, FF). Случайно меняйте их версии и все будет ок.

Муркетолог. 100 пресс-релизов с прямыми ссылками за 150 баксов? Легко! (http://b2blogger.com) Статейный маркетинг - лучшее лекарство от Минусинска! (http://miralinks.ru)
RT
На сайте с 08.11.2006
Offline
1
#2
MiRaj:
ROST,
1) желательно иметь русский IP
2) представляйте user-agent-а как браузер (IE, Opera, FF). Случайно меняйте их версии и все будет ок.

Спасибо, попробуем этот вариант.

N
На сайте с 21.09.2005
Offline
220
#3
MiRaj:
2) представляйте user-agent-а как браузер (IE, Opera, FF). Случайно меняйте их версии и все будет ок.

Можете привести пример, как это реализовать?... я конечно понимаю, что вопрос из области начальной школы PHP, но все же-)

Поисковое продвижение сайтов в разных тематиках. 641-222
Hkey
На сайте с 30.09.2006
Offline
222
#4

А на счет кликов яша их фиксирует. Их нужно эмулить?

HTraffic.ru (http://HTraffic.ru/) - удобная система для управления контекстной рекламой. тема на форуме (/ru/forum/810827) HTracer (http://htracer.ru/) - скрипт для автопродвижения сайтов по НЧ и СЧ запросам. Для больших сайтов от 100 страниц. (тема на форуме (/ru/forum/676867))
N
На сайте с 21.09.2005
Offline
220
#5
Hkey:
А на счет кликов яша их фиксирует. Их нужно эмулить?

Что значит эмулить клики? ПРи правильном парсинге и так эмулируруется переход по ссылкам-страницам.

Каширин
На сайте с 03.01.2004
Offline
1030
#6
Nitro:
Можете привести пример, как это реализовать?... я конечно понимаю, что вопрос из области начальной школы PHP, но все же-)

Через сокеты.

basterr
На сайте с 24.11.2005
Offline
719
#7

я вот щас в яше на индексацию проверяю. за задержкой в 5 сек. не банят вроде как. хотя неудобно блин конечно.

Yaroslav_Adv
На сайте с 27.09.2005
Offline
199
#8

ROST, есть окольный вариант с Яндекс.XML - можно завести несколько аккаунтов с разными IP-адресами и по истечению 1000 запросов парсить с другого.

С уважением, Ярослав Деревягин Веб-агентство "Found (http://found-it.ru)"
Yaroslav_Adv
На сайте с 27.09.2005
Offline
199
#9
basterr:
за задержкой в 5 сек

Работал с парсером позиций с задержкой в 10 секунд:

1. Неудобно.

2. Забанили.

basterr
На сайте с 24.11.2005
Offline
719
#10

Yaroslav_Adv, странно. а сколько запросов было? у меня где то 5к в день. все нормально, не банят

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий