Особенности парсинга директа

Montoya
На сайте с 30.09.2006
Offline
139
670

Подскажите, пожалуйста, какие есть особенности при парсинге директа? видел скрипт парсера, где была функция проверки слов на наличия англ букв(похожих в написании с русскими) и заменой их на русские. Действительно ли есть такая проблема при парсинге? на что еще стоит обратить внимание?

есть ли такие либо особенности при парсинге https://ad.rambler.ru/swrds/ и http://stat.go.mail.ru/ и др?

Progr@mmer\.
На сайте с 14.10.2007
Offline
44
#1

Особенностей много. Например, капча, про которую так много говорят "мега-парсерщики".

Зы: если кто-то нарвется на нее, то отправьте мне html страничку. Уж очень хочется посмотреть на нее ;)

Вашей девушке не хватает романтики? Черпните её на сайте «Я Люблю Романтику» (http://iloveromantics.ru/). Романтический форум (http://forum.iloveromantics.ru/) для отдыха от нудной работы.
Montoya
На сайте с 30.09.2006
Offline
139
#2
Особенностей много.

Раз особенностей действительно много, поделитесь ими, пожалуйста

Montoya добавил 06.03.2008 в 13:03

отправьте мне html страничку

вот собственно скрин

взял с другой темы, кто то уже выкладывал

A
На сайте с 19.01.2007
Offline
23
#3
Montoya:
вот собственно скрин
взял с другой темы, кто то уже выкладывал

Что то я не понял! На скрине, если капча, то как же внизу могут выводится поисковые фразы?

icq: 315-477-761
Montoya
На сайте с 30.09.2006
Offline
139
#4

еще раз скажу, скрин не мой, но сам я тоже пару раз нарывался на капчу, ввести ее нужно для того что бы сделать следующую выборку

response
На сайте с 01.12.2004
Offline
324
#5

я нарывался на капчу очень давно, когда вручную (!!!) парсил директ. с тех пор ее не видел. сейчас просто тормозит подгрузка чего-то там, в итоге софт как бы получает таймаут (кстати, может и капчу грузят - я хз, код не смотрел). Но это в директе. Если смотреть через вордстат, то просто таймаут.

зы

проверял подмену букв - не нашел.

ззы

по-моему буквально всера в каком-то из топиков отвечал то же самое :)

Однопоточный парсер ключевых слов Магадан (http://magadanparser.ru) (со свистелками) Многопоточный парсер ключевых слов Солнечный (http://sunnyparser.ru) (без свистелок)
Progr@mmer\.
На сайте с 14.10.2007
Offline
44
#6

Скрин уже видел. Нужна именно html-страница (и лучше не одна).

Montoya
На сайте с 30.09.2006
Offline
139
#7

как можно показать страницу с капчей? я наверное что то не понимаю, но капча появляется при большом количестве запросов за короткий промежуток времени. и если на определенной странице парсинга определенного кея я нарвусь на капчу, то вы загрузив эту страницу не увидите ее, т.к. вы не сделали для этого такое же количество запросов :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий