- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Маркетинг для шоколадной фабрики. На 34% выше средний чек
Через устранение узких мест
Оксана Мамчуева
Да, все работает именно так.
Теперь дело за малым... осталось только выяснить зачем оно так работает?
Теперь дело за малым... осталось только выяснить зачем оно так работает?
Чтобы предложить пользователям не только плоский, но и "объемный" способ обхода данных по заданному кейворду. Функцией ведь можно и не пользоваться.
но и "объемный" способ обхода данных по заданному кейворду. Функцией ведь можно и не пользоваться.
Ну так а нужно то оно зачем? Какие то преимущества даёт или что?
ЗЫ. Кстати, есть подозрение, что интерфейс с антигейтом на обрабатывает не/неверно распознанные капчи, так как функцию /проверить частотность с ""/ пришлось 4 раза запускать чтобы она допроверила все отпарсенные в вордстате ключи.
Будет долбить слово, пока не получит ответ. Однако это ж какие таймауты нужно было ставить, чтобы капчу словить :).
а разве это даст дополнительные ключи?
Да, конечно.
1. Очевидное: всего 40 страниц по одному ключу, если ветка длинная то её хвост просто не спарсится. На странице 50 ключей х 40 страниц = 2000 ключей. Всё, это максимум. Например: «окна» заканчиваются на частоте 327.
2. Не очевидное: даже в коротких ветках при парсинге входящих в них ветвей ключей получается больше. Причём значительно. Это к разработчикам вордстата.
Однако это ж какие таймауты нужно было ставить, чтобы капчу словить :).
Тайм-ауты по умолчанию. И это... на проверке частотности с "" капча вылазит буквально на 30-40 запросе и после того как вылезла 1-ый раз вылазит на каждый запрос. Проверка с кавычками же 1 ключ = 1 запрос, в отличии от первоначального сбора частотности, где отдаётся страницами по 50 ключей. Так что ничего удивительного.
jorevo добавил 07.10.2010 в 21:09
Очевидное: всего 40 страниц по одному ключу, если ветка длинная то её хвост просто не спарсится. На странице 50 ключей х 40 страниц = 2000 ключей. Всё, это максимум. Например: «окна» заканчиваются на частоте 327.
Вот теперь понятно... спасибо. )
jorevo добавил 07.10.2010 в 21:11
Будет долбить слово, пока не получит ответ.
Дык не долбит жешь, говорю же 4 раза запускал частотность "", чтобы добить "хвост". Видимо программа просто не отрабатывает когда антигейт возвращает ответ = не распознанная капча.
С адекватными таймаутами в 3000 мс я парсил по несколько тысяч запросов по всем частотностям без единой капчи. Не знаю, может мне везло :).
Программа ждет пока капча не будет распознана, а когда получает ее числовое представление пробует пропихнуть его в яндекс. Если на другом конце ее распознали неправильно, то будет отправлен новый запрос с новой капчей. Однако прерываться процесс не должен.
С адекватными таймаутами в 3000 мс я парсил по несколько тысяч запросов по всем частотностям без единой капчи. Не знаю, может мне везло :).
Кстате, а почему бы в программе по умолчанию после инсталляции не установить дефолтные значения 1000/3000? Там же нули прописываются. Попробую с задержками.
Ну что я могу тут сказать? Вы говорите как должно быть, а я говорю как есть на деле. Может быть надо указать отличное от нуля кол-во повторных попыток?
P.S. И вдогонку - в титле программы (синяя полосочка наверху) очень не помешало бы указывать название текущего проекта. Сейчас определить какой проект подгружен очень затруднительно.
И при загрузке нового проекта не восстанавливается текущего значения поля Запрос в главном окне... как я понимаю - оно просто не сохраняется при сохранении проекта.
Ну что я могу тут сказать? Вы говорите как должно быть, а я говорю как есть на деле. Может быть надо указать отличное от нуля кол-во повторных попыток?
Надо.
Cделаем.
Да, эта информация в файле проекта не сохраняется.
P.S. И вдогонку - в титле программы (синяя полосочка наверху) очень не помешало бы указывать название текущего проекта. Сейчас определить какой проект подгружен очень затруднительно.
Хорошо бы еще сделать кнопку "Сохранить текущий проект в тот же файл" что бы каждый раз мучительно не искать текущий в папке с риском перезаписать еще какой нибудь при неудачном тыке.