Ставьте человеческие таймауты (гарантировано по несколько секунд, а не от 50 до 1000 мс, например), используйте прокси-сервера. Глубина парсинга влияет на количество результатов в таблице по окончании парсинга (т.е. косвенно на количество загружаемых страниц -> увеличивает вероятность появления капчи). Если Вам не нужны результаты, полученные путем подстановки в качестве запроса полученных на предыдущих итерациях работы алгоритма слов, то ставьте глубину парсинга = 0. Параметр "Количество страниц" отвечает за то, сколько раз для каждого анализируемого слова программа будет переходить по ссылке "Следующая" в блоке навигации страниц Yandex.Wordstat.
Сейчас, насколько я понимаю, если Яндекс вешает на пользователя капчу, то она появляется сразу вперед на следующий запрос. Поэтому она и вылезает при каждой новой загрузке страницы. Помогает смена IP-адреса (использование прокси или переподключение интернета, если IP раздаются динамически) или ожидание (несколько часов, до тех пор, пока капча не пропадет).
Насчет капчи обещаю провести дополнительное исследование :).
Если что-то не парсится, пожалуйста, сперва проверьте правильность ввода логина, пароля а также других форм. Если все равно не работает, скидывайте в личку ссылку на архив с файлом проекта и config.xml - будем смотреть, что там не так.
Окей, в следующей версии с багфиксами и новыми опциями будет включено и Ваше пожелание.
Можно, только это к сути вашего вопроса отношения не имеет :). Это мы уже технические детали реализации ПО для съема позиций начали обсуждать :).
Я бы верил сервису с большей репутацией, дополнительно проверив бы выборочно тройку другую запросов руками. Расхождения могут быть из-за различной реализации программ, как Вам уже сказали. Кто-то сделал все по-честному с настройкой нужного региона, кто-то снимает позиции для региона, определяемого Яндексом автоматически на основании IP пользователя, а кто-то вообще нулевой по умолчанию прописывает :). Отсюда и разница. Мелкие баги парсинга в расчет не беру.
Можно как lr приписывать, так и кукесы сохранить.
Так, а для кого мы делали кнопку "Добавить из буфера"? Нажимаете и в обычном текстовом поле все вводите. Проще быть не может :).
Ну в Яндексе, например, можно программой собрать кукесы, которые будут принудительно выставлять нужный регион :).
Спасибо за замечание. Глюк найден и устранен! В следующем обновлении будет все работать.
MIND добавил 30.09.2010 в 16:05
К сожалению, не могу помочь Вам с этой проблемой. Может быть, дело в Вашей не совсем правильно работающей ОС?
Хм, у меня тоже такое дело бывает, когда специально тысячу запросов набиваю с таймаутом 3 мс, чтобы до капчи достучаться потестить. Помогает либо смена ИП, либо несколько часовая пауза :). Вот в этом случае вордстата отдает капчу на каждый запрос.
Wodstat парсится не на движке браузера, поэтому никаких куков с Flash или Javascript, если того я сам не пропишу цепляться не будет. Я еще разок гляну, что там не так может быть, просто с релизом сроки поджимали :).
Смена ИП + очистка кукесов гарантированно избавляет от капчи, если ИП новый также не был заблокирован уже.
Если в настройках отключен Antigate - будет вылезать окно с предложение ввести капчу вручную, как это было раньше. Если включен - будет автоматически направлен запрос к Antigate.