j1gs4w88

Рейтинг
99
Регистрация
21.05.2009

Посетил данный семинар, чему искренне рад! Информация четко структурирована, и охватывает все этапы продвижения крупного портала. Узнал интересные методы автоматизации различной монотонной работы. Рассмотрены схемы реализации полной индексации крупного портала, даже для страниц не содержащих текстового контента. Парни из Wikimart вообще продемонстрировали свои разработки в боевом виде. Буду постепенно реализовывать предложенные на семинаре идеи!

miraxi:
С ротацией по капче будет быстрее, тк в списке могут попадаться мертвые прокси, и если мертвых штук 10 подряд, да еще и на каждый запрос надо найти рабочий прокси, а так прога будет постоянно работать с темеже прокси до появления капчи.

У меня приватные анонимные прокси с авторизацией по логину и паролю.

С капчей возникла проблема, т.к. в браузере ИЕ сбились куки на wordstat.yandex.ru и вордстат отдавала капчу при каждом запросе. Зашел в ИЕ на wordstat.yandex.ru была капча, нажал F5, браузер получил и сохранил куки, дальше парсинг вордстата в многопоточном режиме с разумными задержками шел как по маслу, 25к запросов(все частотности) без единой капчи.

MIND:
Хм, видимо не пошло на пользу нововведение последнее :). Насчет механизма все верно.

Нет пошли, капчей стало меньше тратится и время работы уменьшилось, просто первоначально я думал о другой ротации - при попадении на капчу смена прокси, но не могу сказать какой способ работы был бы быстрее.

edgrak:
Globatel (www.globatel.ru) предлагает прокси для XML Яндекса, все работает на УРА.

P.S. (для модераторов) Я не представитель этого хостинга, просто этот сервис является ответом на вопрос ТС и также я искренне доволен работой этого хостинга, ссылка не реферальная.

Также рекомендую данный сервис, я с помощью их проксей обрабатываю прямую выдачу.

Я до последних дней также не нарывался на капчи вордстата при парсинге в 20к запросов в день со всеми частотностями, в последние же дни невероятное количество капчей выдается.

Каким образом происходит ротация проксей? При каждом запросе меняется прокси (в однопоточном режиме без проксей). В многопоточном режиме с проксями число проксей делится на число потоков и для каждого потока идет ротация своего блока проксей для каждого запроса. При попадании на капчу со включенным антигейтом идет распознование капчи. Я правильно понял?

MyOST:
это вопрос наверное не к нам, к примеру я в вордстате вообще не натыкаюсь на капчу, размеры парсинга при работе правда скромные - 2-10к

2-10к в день с частотностями "!слово"?

MIND:
Принудительной смены прокси при встрече капчи пока что нет. Но ротация обычная функционирует.

Как раз такую ротацию я и имел ввиду, чтобы можно было выигрывать от одновременного использования проксей и антигейта.

Что произошло с вордстатом? Раньше Яндекс не выдавал такого страшного количества капчей.

Все таки непонятно работатет ли ротация прокси серверов со включенным антигейтом(число прокси больше числа потоков)? Хотелось бы экономить антигейт, чтобы при попадании на капчу сначала была попытка переключиться на другой прокси.

MyOST:
MIZER, применимо к яндексу, я думаю проксю стоит менять через каждые 30-35 запросов, т.к. в среднем на 45 запросе она появляется во всей красе, иногда можно бить по 90 запросов без капчи, но более или менее стандартно - 45й запрос

Прям мысли читаете) Также очень хотел видеть подобную возможность, чтобы использовались прокси превышающие по кол-ву число потоков и при этом использовался антигейт.

j1gs4w88 добавил 08.02.2011 в 23:12

MIND:
Завтра будет обновление, в котором будут учтены некоторые приоритетные пожелания пользователей.

Очень и очень буду ждать!

При добавлении большого числа прокси-серверов, чтобы нажать кнопку сохранить изменения нужно теперь прокручивать ползунок полностью вниз, это не очень удобно.

j1gs4w88 добавил 03.02.2011 в 19:55

Резко обнулился конфиг и выдает разные ошибки при запуске, хотя еще днем активно работал программой. Только у меня такое? Если да выложу скрины ошибок.

Всего: 337