MIND

MIND
Рейтинг
238
Регистрация
08.03.2007
ivan_i:
добрый вечер
я не знаю, что делать - яндексовая капча просто достала. и это мягко сказано.
не могу вообще спарсить вордстат.яндекса.
подскажите, что нужно сделать, как настроить программу, чтобы не было этой капчи.
может есть какие-то ограничения в программе, т.е. парсить вордстат не списком, а по одному запросу и глубину парсинга может нужно указывать не более какой-то величины.
у меня сейчас эта капча теперь и через веб на каждый чих.

Ставьте человеческие таймауты (гарантировано по несколько секунд, а не от 50 до 1000 мс, например), используйте прокси-сервера. Глубина парсинга влияет на количество результатов в таблице по окончании парсинга (т.е. косвенно на количество загружаемых страниц -> увеличивает вероятность появления капчи). Если Вам не нужны результаты, полученные путем подстановки в качестве запроса полученных на предыдущих итерациях работы алгоритма слов, то ставьте глубину парсинга = 0. Параметр "Количество страниц" отвечает за то, сколько раз для каждого анализируемого слова программа будет переходить по ссылке "Следующая" в блоке навигации страниц Yandex.Wordstat.

Сейчас, насколько я понимаю, если Яндекс вешает на пользователя капчу, то она появляется сразу вперед на следующий запрос. Поэтому она и вылезает при каждой новой загрузке страницы. Помогает смена IP-адреса (использование прокси или переподключение интернета, если IP раздаются динамически) или ожидание (несколько часов, до тех пор, пока капча не пропадет).

Насчет капчи обещаю провести дополнительное исследование :).

Если что-то не парсится, пожалуйста, сперва проверьте правильность ввода логина, пароля а также других форм. Если все равно не работает, скидывайте в личку ссылку на архив с файлом проекта и config.xml - будем смотреть, что там не так.

AntonR:
Сделайте, пожалуйста, в вкладке
Настройка -> Парсинг -> Регионы
чтобы можно было выбирать также и основной Гугл: com.ua, ru

Окей, в следующей версии с багфиксами и новыми опциями будет включено и Ваше пожелание.

Hrom4:
А можно поподробнее объяснить? Если не сложно :)

Можно, только это к сути вашего вопроса отношения не имеет :). Это мы уже технические детали реализации ПО для съема позиций начали обсуждать :).

Это с чем связано? Не 100% конечно но 75% точно есть расхождения.

Я бы верил сервису с большей репутацией, дополнительно проверив бы выборочно тройку другую запросов руками. Расхождения могут быть из-за различной реализации программ, как Вам уже сказали. Кто-то сделал все по-честному с настройкой нужного региона, кто-то снимает позиции для региона, определяемого Яндексом автоматически на основании IP пользователя, а кто-то вообще нулевой по умолчанию прописывает :). Отсюда и разница. Мелкие баги парсинга в расчет не беру.

saleseo:
75% это жестко.
Нормальные чекеры 1 в 1 показывают, там можно в Я прописать регионы и не зависеть от кукисов

Можно как lr приписывать, так и кукесы сохранить.

получаем массу лишних движений: мышкой открыли строку, руки на клавиатуру - написали стоп-слово,
снова мышь - открыли строку, снова клава - написали стоп-слово.
Работать, импортируя заранее заготовленный список, не всегда удобно /эффективно.
Можно ли сделать по Enter не создание строки (их быстро и несложно создать кнопкой),
а, собственно, переход на другую строку и, главное, открытие (!) строки для редактирования??

Так, а для кого мы делали кнопку "Добавить из буфера"? Нажимаете и в обычном текстовом поле все вводите. Проще быть не может :).

Поисковые системы "смотрят" откуда пришел пользователь (по его IP адресу), автоматически давая выдачу соответствующую его региону, по этому использование разношерстных прокси серверов тоже дает сильную разницу в позициях, правда для яндекса это не так страшно как для гугла.

Ну в Яндексе, например, можно программой собрать кукесы, которые будут принудительно выставлять нужный регион :).

COPATHuK:
MyOST, Да, именно так я и делаю. При нажатии на иконку "Я" - мгновенно программа вылетает.
Только разница в том, что я просто загружаю свой список слов, и сразу перегоняю его в окно для работы с сайтом, не совершая никаких манипуляций в первом окне (работа с ключевыми словами)

Спасибо за замечание. Глюк найден и устранен! В следующем обновлении будет все работать.

MIND добавил 30.09.2010 в 16:05

Londongirl:
Очень хотелось бы купить Вашу программу.
Файл HID.exe не открывается, так как не является приложением Win32. Какие мне надо предпринять след шаги?

К сожалению, не могу помочь Вам с этой проблемой. Может быть, дело в Вашей не совсем правильно работающей ОС?

Seo2z:
кул, вордстат только сейчас поставил каптчу по умолчанию или я ошибаюсь?
http://wordstat.yandex.ru/

Хм, у меня тоже такое дело бывает, когда специально тысячу запросов набиваю с таймаутом 3 мс, чтобы до капчи достучаться потестить. Помогает либо смена ИП, либо несколько часовая пауза :). Вот в этом случае вордстата отдает капчу на каждый запрос.

Wodstat парсится не на движке браузера, поэтому никаких куков с Flash или Javascript, если того я сам не пропишу цепляться не будет. Я еще разок гляну, что там не так может быть, просто с релизом сроки поджимали :).

Через прокси тоже самое выдает?
да. К тому же в акке, вне акка - разницы нет

Смена ИП + очистка кукесов гарантированно избавляет от капчи, если ИП новый также не был заблокирован уже.

Seo2z:
без него капча будет вылазить?

Если в настройках отключен Antigate - будет вылезать окно с предложение ввести капчу вручную, как это было раньше. Если включен - будет автоматически направлен запрос к Antigate.

Всего: 3048