Key Collector — автоматизированная система анализа семантического ядра

[Удален]
#431
MIND:
Да, все работает именно так.

Теперь дело за малым... осталось только выяснить зачем оно так работает?

MIND
На сайте с 08.03.2007
Offline
238
#432
jorevo:
Теперь дело за малым... осталось только выяснить зачем оно так работает?

Чтобы предложить пользователям не только плоский, но и "объемный" способ обхода данных по заданному кейворду. Функцией ведь можно и не пользоваться.

Key Collector - автоматизированная система анализа семантического ядра (/ru/forum/863504)
[Удален]
#433
MIND:
но и "объемный" способ обхода данных по заданному кейворду. Функцией ведь можно и не пользоваться.

Ну так а нужно то оно зачем? Какие то преимущества даёт или что?

ЗЫ. Кстати, есть подозрение, что интерфейс с антигейтом на обрабатывает не/неверно распознанные капчи, так как функцию /проверить частотность с ""/ пришлось 4 раза запускать чтобы она допроверила все отпарсенные в вордстате ключи.

MIND
На сайте с 08.03.2007
Offline
238
#434

Будет долбить слово, пока не получит ответ. Однако это ж какие таймауты нужно было ставить, чтобы капчу словить :).

overnight
На сайте с 23.05.2008
Offline
262
#435
jorevo:
а разве это даст дополнительные ключи?

Да, конечно.

1. Очевидное: всего 40 страниц по одному ключу, если ветка длинная то её хвост просто не спарсится. На странице 50 ключей х 40 страниц = 2000 ключей. Всё, это максимум. Например: «окна» заканчиваются на частоте 327.

2. Не очевидное: даже в коротких ветках при парсинге входящих в них ветвей ключей получается больше. Причём значительно. Это к разработчикам вордстата.

[Удален]
#436
MIND:
Однако это ж какие таймауты нужно было ставить, чтобы капчу словить :).

Тайм-ауты по умолчанию. И это... на проверке частотности с "" капча вылазит буквально на 30-40 запросе и после того как вылезла 1-ый раз вылазит на каждый запрос. Проверка с кавычками же 1 ключ = 1 запрос, в отличии от первоначального сбора частотности, где отдаётся страницами по 50 ключей. Так что ничего удивительного.

jorevo добавил 07.10.2010 в 21:09

overnight:
Очевидное: всего 40 страниц по одному ключу, если ветка длинная то её хвост просто не спарсится. На странице 50 ключей х 40 страниц = 2000 ключей. Всё, это максимум. Например: «окна» заканчиваются на частоте 327.

Вот теперь понятно... спасибо. )

jorevo добавил 07.10.2010 в 21:11

MIND:
Будет долбить слово, пока не получит ответ.

Дык не долбит жешь, говорю же 4 раза запускал частотность "", чтобы добить "хвост". Видимо программа просто не отрабатывает когда антигейт возвращает ответ = не распознанная капча.

MIND
На сайте с 08.03.2007
Offline
238
#437
Тайм-ауты по умолчанию. И это... на проверке частотности с "" капча вылазит буквально на 30-40 запросе

С адекватными таймаутами в 3000 мс я парсил по несколько тысяч запросов по всем частотностям без единой капчи. Не знаю, может мне везло :).

Видимо программа просто не отрабатывает когда антигейт возвращает ответ = не распознанная капча

Программа ждет пока капча не будет распознана, а когда получает ее числовое представление пробует пропихнуть его в яндекс. Если на другом конце ее распознали неправильно, то будет отправлен новый запрос с новой капчей. Однако прерываться процесс не должен.

[Удален]
#438
MIND:
С адекватными таймаутами в 3000 мс я парсил по несколько тысяч запросов по всем частотностям без единой капчи. Не знаю, может мне везло :).

Кстате, а почему бы в программе по умолчанию после инсталляции не установить дефолтные значения 1000/3000? Там же нули прописываются. Попробую с задержками.

Однако прерываться процесс не должен.

Ну что я могу тут сказать? Вы говорите как должно быть, а я говорю как есть на деле. Может быть надо указать отличное от нуля кол-во повторных попыток?

P.S. И вдогонку - в титле программы (синяя полосочка наверху) очень не помешало бы указывать название текущего проекта. Сейчас определить какой проект подгружен очень затруднительно.

И при загрузке нового проекта не восстанавливается текущего значения поля Запрос в главном окне... как я понимаю - оно просто не сохраняется при сохранении проекта.

MIND
На сайте с 08.03.2007
Offline
238
#439
jorevo:

Ну что я могу тут сказать? Вы говорите как должно быть, а я говорю как есть на деле. Может быть надо указать отличное от нуля кол-во повторных попыток?

Надо.

в титле программы (синяя полосочка наверху) очень не помешало бы указывать название текущего проекта.

Cделаем.

И при загрузке нового проекта не восстанавливается текущего значения поля Запрос в главном окне... как я понимаю - оно просто не сохраняется при сохранении проекта

Да, эта информация в файле проекта не сохраняется.

alekzey
На сайте с 19.09.2005
Offline
140
#440
jorevo:
P.S. И вдогонку - в титле программы (синяя полосочка наверху) очень не помешало бы указывать название текущего проекта. Сейчас определить какой проект подгружен очень затруднительно.

Хорошо бы еще сделать кнопку "Сохранить текущий проект в тот же файл" что бы каждый раз мучительно не искать текущий в папке с риском перезаписать еще какой нибудь при неудачном тыке.

WBR, AlekZey Абарис (http://abaris.ru) - продвижение сайтов в Новосибирске (http://www.siteseo.ru) Как узнать траст домена (http://abaris.ru/trust.html)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий