Sattt

Sattt
Рейтинг
131
Регистрация
12.04.2008
kysok sabaki:
тогда, как вариант, показывать Захламленность не процентным выражением, а текстовым. например, "норма", "средне", "выше среднего", "ппц".
и за то что выше, например, "средне" портить рейтинг на 5-10 пунктов.

Лично я против. Гораздо удобнее видеть конкретное число размещенных статей, чем какие-то неоднозначные параметры. Ничего секретного тут нет.

В GGL вот нет такого параметра и часто попадаются заспамленные площадки с высоким %. Но там хоть не надо возиться со статьями и цены поменьше.

kysok sabaki:
предлагаю убрать из описания площадки кол-во размещённых статей, т.к. это, в некотором смысле, публикация конфиденциальной информации - мало ли что, где, почём и сколько.
есть же параметр "Заспамленность" - вполне себе достаточно. а?

В чем смысл, если заспламленность и является [проиндексировано страниц в Я / количество статей]? Вычислить всё равно можно.

Год назад была обратная ситуация: сайту по одному добавлялись регионы с 1 до 5.

Позиции при этом не страдали, только в новых регионах поднимались.

4ept:
можно чаще

Отлично.

4ept:

разве удобен будет серверный скрипт? он удобен для ежедневной статистики.
вам я так полагаю нужен парсер вордстат чтобы составлять коммерческое предложение по каким-то сайтам которые еще не продвигаете, т.е. данные нужны быстро и в большом объеме, я полагаю для этого удобнее десктопная программа. и мы её анонсируем как будет готова

Скрипт нужен для мониторинга НЧ в интернет-магазинах, которых там тысячи. А т.к. это всё товары, то обновляться нужно каждый АП вордстата.

По поводу спроса на подобный функционал. К БД Лидера ведь можно подключаться для импорта данных прямо в админку. Что это дает, думаю, объяснять не нужно :)

P.S. Десктопный софт уже существует и много.

4ept:
Скрипт парсер позиций, а не вордстата, циферка из вордстата просто дополнительная информация (обновляемая раз в месяц).
Парсится вордстат без капчи.

Т.е. в 3 версии период обновление вордстат настроить нельзя, только раз в месяц?

P.S. Очень зря что "Скрипт парсер позиций, а не вордстата", ниша то не занята. А спрос огромный.

Навигатор:

В выдаче вордстата и прямой выдаче поиска яндекса разные системы защиты от парсинга. В вордстате они не такие жесткие все-таки.

Можете назвать максимальное количество спарсенных запросов, скажем, за неделю, при котором ip не банится?

Или хотя бы порядок цифр. Планирую подключать пару десятков тысяч запросов, хотелось бы заранее прикинуть сколько для этого нужно ip.

wnt:

1) Разбавляете ли вы анкоры для НЧ запросов. Допустим у вас есть запрос - "купить ноутбук acer aspire one" - есть смысл его разбавлять вообще ?

2) При разбавлении анкоров, если это двух-трех словники, вы стараетесь сохранить фразу целиком, не разбивая ее ?

3) Разбавляя анкор имеет ли смысл придумывать свои, которых нету в wordstat ?

1. Зависит от количества ссылок и самого запроса. Для указанного примера я бы начал разбавлять после 5 ссылок и по нарастающей.

2. Целиком, но можно склонять. Или иногда менять местами: acer aspire => aspire acer, купить ноутбук acer aspire one => ноутбук acer aspire one купить.

3. Нет. Если вордстата не хватает, придумывать самые вероятные.

Навигатор, насколько успешно работает парсер вордстата в 3 версии? Сможет ли собирать пару тысяч запросов? А десятков тысяч?

В первую очередь интересуют ограничение на 1 ip. Например, парсить позиции не через XML практически невозможно, ip сразу уходят в бан.

k_titov:
в ггл больше предложений???
как раз наоборот. даже если просто взять статистику по сайтам в миралинксе в два раза больше

В миралинксе 80% ВМ (до 700р) размещают статьи в отдельном кластере. И очень часто даже не удосуживаются скрыть это структурой урлов. В GGL такое встречается крайне редко, процентов 5-10 максимум.

Вот и считаем.

Возможность задать свой title/h1 в миралинксе тоже не гарантирована, нужно предварительно анализировать каждую площадку. По статистике, процентов 10 ВМ лепят что-то свое.

Остальные различия очевидны.

Лучше/хуже тут нет, всё зависит от возможностей и потребностей.

MiRaj:
Рандомные из тех, что размещались более определенного периода.
Если показывать совсем свежие - будет соблазн лазить по каталогу и набирать свежий вкусный непроиндексированный контент. Мы вебмастеров в обиду не даем.

Какого конкретно периода?

Просмотрел десяток сайтов с указанием даты размещение, почти везде 2008-2009 год попадается.

Хотя было бы логичнее показывать именно последние статьи, чтобы видеть как ВМ размещает сейчас. 2-3 недели задержки роли не играет, но не столько же.

Всего: 604