Сегодня, скорее всего, будет по выбору ;)
По соседству тема с программкой Микроволновка. Заточена как раз под это.
Сейчас правда с вордстатом у всех трудности, но это поправимо.
Спасибо, инвайт получил. Больше не надо:)
Выход обновления немного задерживается. Главной задачей сейчас является прикрутка antigate для распознования каптчи.
BredoGen. добавил 22.01.2010 в 17:02
Удалось обойти каптчу другим простым методом. Сейчас проверяю, насколько эффективно.
Поддержка антигейта будет в любом случае.
Ну и меня угостите, если можно. Будем прикручивать :)
После распознования каптчи яндекс ставит куку, которая позволяет спарсить еще 5-7 страниц, потом опять каптча...
У Магадана такая же проблема. Дела плохи, Яндекс что-то подкручивает :)
BredoGen. добавил 22.01.2010 в 10:54
Есть "другой" Вордстат, там кажется нет каптчи вообще. Но если его прикрутить, накроется очень быстро, если вообще уже не накрылось :)
Можно сказать, что дорвейщик. Когда нужны деньги - делаю дорвеи, в остальное время их трачу :)
Значит действительно каптча. С подставновкой заголовков будет лучше.
И прогнозируя следующий вопрос. С браузера каптчи может не быть из-за установленных cookies, попробуйте удалить куки яндекса и каптча появится.
Дело в том, что из всех языков, которые я знаю, нет ни одного кроссплатформенного, кроме серверного PHP. Эта программа написана на Дельфи, возможно будет переделана на C++, как только нормально в нём разберусь.
Уже добавил специальную галочку в настройках ;)
Завтра будет обновление.
Ничего подобного у себя не замечаю, какая ОС?
В любом случае в след. версии будет сворачивание в трей и подробная обработка ошибок.
BredoGen. добавил 21.01.2010 в 17:12
Воспроизвёл, скоро будет обновление с:
1. Подробной обрабокой ошибок
2. Работа из-под трея
3. Улучшенная подстановка заголовков
Обнаруженные ошибки прошу присылать в личку.
BredoGen. добавил 21.01.2010 в 17:39
Следом в планы идёт:
1. Работа с прокси
2. Подставление своих user agent
3. Более удобная фильтрация