Key Collector - автоматизированная система анализа семантического ядра. Часть 10

AC
На сайте с 31.03.2010
Offline
75
#61
Str256:



Это с прокси или с реального IP? Для начала зайдите в яндекс просто без программы и оцените что там за обстановка.

с реального айпи, страница вордстат без проги - доступ запрещен

MIND
На сайте с 08.03.2007
Offline
238
#62

AnnetCat, Вас забанил Wordstat. Для решения этой проблемы можно попробовать сменить IP-адрес, если он выдается динамически, подключить прокси-серверы или попробовать альтернативный режим сбора через Yandex.Direct (включается в Настройках - Парсинг - Yandex.Wordstat).

Более подробно о всех способах работы с Вордстатом мы написали в статье http://www.key-collector.ru/news/wordstat-direct2.php - их целых 4 штуки.

Для сбора частотностей рекомендуем скоростной 4-й метод сбора: www.key-collector.ru/news/wordstat-direct2.php

Key Collector - автоматизированная система анализа семантического ядра (/ru/forum/863504)
S2
На сайте с 07.01.2008
Offline
611
#63

MIND, вы читали эти 2-а моих поста, я там просил сделать кой-чего:

/ru/forum/comment/11707984

/ru/forum/comment/11711273

И вот с этим совершенно непонятно.

А КК мне вообще непонятно как качество прокси проверяет, каждый раз одно и тоже независимот от качества прокси, строгая проверка с указанием что закапчёванные исключать и время ожидания 8000мс - 35 в итоге зелёных, загружаю реальную задачу - проверка словоформ в яндекс.поиске - сразу 33 штуки вылетело, осталось только 2. И так каждый раз, из тех что проверены, на реальных задачах в разы меньше работает.

Добавил скажем 200 штук на проверку, 15 потоков 8000сек задержка. считать закапчёванные плохими, яндекс.поиск - проверка обычная, не профессиональная. Выдало 35 зелёных, указываю реальную задачу - в течение нескольких секунд вылетает 90% на 5-и потоках. И так постоянно, на паблик прокси. Не понятно как прога отсеивает плохие, при тесте прокси - хотелось бы чтобы она гарантированно живые оставляла.

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
MIND
На сайте с 08.03.2007
Offline
238
#64

Str256, все читали, спасибо. Проверка выполняется по фактическим результатам. Вылетать на реальных задачах может из-за отличающихся настроек. Чтобы сказать точнее, нужно посмотреть конфиг.

Unlock
На сайте с 01.08.2004
Offline
776
#65

Str256, проблема в том, что рано или поздно, при том, что точно есть живые прокси, вылетает:

28.04.2013 3:38:47: ошибка при работе с поиском Google (была получена блокировка в поиске Google): прокси (http://xxx.x.xxx.xx:8085/) удаляется из списка активных . Поток завершен
28.04.2013 3:38:50: процесс анализа позиций в ПС Google завершен

Причем в Яндексе через пару часов тоже такое вылетело. Сейчас вроде подобрал настройки или просто повезло, уже три часа шуршит и даже Гугл.

Но я с антигейтом делаю, иначе вылетают IP пачками, если капчи не распознавать. Антигейт копейки стоит, в моем случае.

P.S. Для слов где пустые данные или надпись "нет данных" - имеет смысл отобрать их и прогнать еще раз отдельно?

Есть желание, - тысяча способов; нет желания, - тысяча поводов! /Петр-I/.
S2
На сайте с 07.01.2008
Offline
611
#66
Unlock:
P.S. Для слов где пустые данные или надпись "нет данных" - имеет смысл отобрать их и прогнать еще раз отдельно?

Имеет. Вообще должно такое на автомате допроверяться, но иногда попадаются стоп-слова.

---------- Добавлено 28.04.2013 в 18:14 ----------

MIND:
Проверка выполняется по фактическим результатам.

Не уверен. Смотря как проверяется.

Когда яндекс выдаёт каптчу, он её выдаёт не на главной странице, а на странице результатов поиска. Иначе говоря можно зайти на стартовую страницу яндекса совершенно свободно, ввести слово в поиск и нажать переход и только после этого откроется страница с сообщением что типа вы робот и предложением ввести каптчу. Поэтому если прокси проверяется просто на доступ к ya.ru yandex.ru - это ничего не значит, каптчи там не будет если уж IP окончательно не забанен. Надо кидать запрос с каким-то ключём и смотреть что там будет - результат или каптча. Если не будет каптчи - значит проверка пройдена.

Unlock
На сайте с 01.08.2004
Offline
776
#67

MIND, а почему закрыт тикет, но ответа по сути не было. Не очень понимаю. Хотел дописать туда информацию, а гляжу уже закрыт тикет. Непонятно.

S2
На сайте с 07.01.2008
Offline
611
#68

Unlock, сами по себе тикеты не закрываются. Вы могли случайно на крестик нажать в конце названия тикета и он закрылся.

Unlock
На сайте с 01.08.2004
Offline
776
#69

Str256, это почти исключено. Прикрепил файлы, написал ответ и отправил его. А потом хотел дописать, но тикет закрыт.

---------- Добавлено 28.04.2013 в 20:37 ----------

Для съема позиций важно чтобы IP были российскими? В смысле чтобы позиции точно определялись.

R
На сайте с 15.03.2010
Offline
94
#70

есть ли в планах создание возможности парсинга сразу ли статистики нескольких сайтов? была бы полезная фикча

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий