MyOST

MyOST
Рейтинг
559
Регистрация
22.01.2006
юни:
А почему вдруг?

Потому что нагрузку нужно создавать пропорционально, а не просто загнав несколько десятков тысяч слов, далеко не всегда нужно все из них сканировать, это касается и анализа через сервисы и через ПС.

Нужно понимать, что не один такой, кто парсит

SEOSPIDER:
На аудиты сайтов выложите кто-нибудь

не ну аудиты, это уже не договора, здесь уже не все так просто

Если договор - набор стандарт пунктов + свои примочки и старховка жо..

то над аудитом уже индивидуальная, а не шаблонная работа идет

SEOSPIDER:
В долгу не останусь, есть опусы в виде КП и договоров, тоже конец прошлого года.

ну и где? :)

naf:
А какой тайм аут не малый? Тот который я поставил указан у вас в хелпе

в хелпе у нас расчет не на такие объемы парсинга, это нужно понимать

naf:
Я и пытаюсь понять может ли ваша программа спарсить подсказки только по нужному мне ключу, для этого и выставляю глубину 1.

может, но для таких зверских объемов не обойтись 50 проксями, возьмите хотя бы 200 хороших проксей

naf:
На счет бана аккаунта в других системах - непонял?

ну загнать 24к слов на оценку в ссылочных агрегаторах, я не удивлюсь, если аккаунт забанят

naf:
Это что значит?
Как с этим бороться и надо ли с этим бороться?

ну вообще, как бы грубо это не звучало , но это п...ц

naf:
Введено для парсинга 24000 ключевых слов, для того что бы спарсить по ним подсказки Яндекса, Гугла и Рамблера.

я бы на месте ПС тоже забанил давным давно такие обращения со скольки проксей бы оно не шло, тем более с таким малым таймаутом

В парсинг подсказок нужно выводить не ВСЕ слова, а только направления!

Я не удивлюсь если следующим шагом при таком подходе будет бан аккаунтов в других системах.

st-key:
1) насколько чаще выключаете отдельный процесс?

в 70% случаев примерно именно отдельный процесс, т.к. в 90% случаев я пользуюсь кнопкой "парсить все" и по обстоятельствам смотрю что лучше отключить, если не так пошло или нужно перезадать параметры, но это индивидуально у каждого.

st-key:
2) а тыщимиллионы новых пользователей? .. и из старых, привыкли далеко не все ..

количество не буду называть, но с внедрения версии 2, с НГ, это гораздо больше, чем было ДО и тут уже не может быть спонтанных изменений, привычки порой выше стоят, чем многие моменты.

st-key:
Может "вообще все" будем выключать одним кликом?, ... а контекст пусть открывает тот, и только тот, кому надо прекратить какой-либо отдельный процесс.

велика вероятность ошибки:

1 - промахнулся

2 - привыкли уже к такому (а сила привычки велика)

st-key:
Перестала срабатывать большая красная кнопка "Остановить". Раз на раз.

проверим

Fruit:
Плохо. Зачем это нужно?

работа со словами в несколько сотен тысяч запросов, станет более удобной, т.к. сейчас файл проекта в 500-600 мб, со словами, считаем в памяти висит, при парсинге, если еще и в 50-100 потоков парсить, то он порядка 1гб+ будет занимать.

Если постранично сделать, то для парсинга будет удобней, на мой взгляд, при этом работать с ядром можно и общим списком.

Как-то так

Им нужно доказывать, что вы уклоняетесь, а не вам, что вы чисты!

Да, забыл уточнить, прошу высказываться жителей РФ :)))

а не мечтателей из других стран, а также теоретиков "в законе".

Тут есть ряд вопросов, с точки зрения налогов и почты.

1. Есть перечисление через рапиду, на почту, тут прозрачно - государство знает.

2. Есть перечисление через рапиду, по форме (шаблону) на вебмани, тут как бы почта обходится лесом, почта не знает, государство не знает.

Во втором варианте есть лишь один момент, который хотелось бы уточнить, дак это по данным в рапиде, насколько они "известны" государству и какая отчетность, есть ли слив, по второму варианту.

Знатоки рапиды есть?

naf:
5) И все таки еще раз про "глубину парсинга", что это значит для каждой вкладки?

в Wordstat это количество спарсенных страниц?
в Подсказках это количество спарсенных слов?

Это не количество. Это то значение, тот уровень в глубину, на который будет исследовано КАЖДОЕ слово.

Чем выше число - тем глубже и медленней.

naf:
1)В "Поисковой выдаче" регион в ПС Yandex имеется в виду вот от сюда? http://search.yaca.yandex.ru/geo.c2n

Если да то может имеет смысл прикрутить это в виде подсказки прямо к программе?

Если мне нужно Москва и Московская область - это 1?

Пока не реализовывали, ибо список будет постоянно пополняться, его нужно актуализировать, следить за этими изменениями.

naf:
3)Как поставить регион для Rambler?

рамблер мертвая поисковая система, ей не известно понятие регион

naf:
4)Из вкладки "Подсказки" для google вы убрали cr и пишите что можно собрать максимальное число подсказок, а если мне не надо максимально?
Я хочу только конкретный регион?

Коллектор запрограммирован на МАКСИМУМ, ограничений мы не придумывали.

naf:
Т.е если я хочу получить wordstat и Подсказки только для конкретного ключевого слова я должен поставить глубину 1, а если хочу спарсить это еще и для полученных данных глубину 2?

Нет, с глубиной нужно исследовать ТЕМАТИКУ, а не слово

naf:
hl_, lr_, cr_ - в подсказке написано : "Значение которое будет присвоено параметру __ в запросе\ пк ПС Google

Где можно посмотреть, как выбрать эти значения?

Если мне опять же нужен регион поиска Москва и Московская область, что туда вводить?

У гугла нет такого разделения

http://www.google.ru/support/mobile/bin/answer.py?hl=ru&answer=37427 например,

Сделаем в мануал подборку ссылок на справку http://www.google.ru/support/websearch/

Сейчас на память не найду эти сведения

jorevo:
Я вот чего не понял: "паектный парсинг слов из лиру" - слова он парсит... а кол-во переходов за отчётный период?

тоже парсит, не отключали, теперь суммарные значения

Если нет - скрин в личку, посмотрим

Всего: 9978