cheboor

cheboor
Рейтинг
123
Регистрация
13.12.2005

Рассмотрите keys.so

Следом можете прислать адрес сайта на info@keys.so и мы подготовим тестовый отчет для Вас. Уверен, у нас данных больше, чем у любого сервиса на рынке.

О нас начали появляться посты в блогах, два последних:

http://adne.info/porybachim

http://spryt.ru/keys-so/

Для последнего записали мини-ролик о работе сервиса, им бы мне и хотелось поделиться в данной ветке

Если у вас возникли вопросы по работе сервиса? буду рад на них ответить. Всегда открыты к предложениям, например, Вы можете оставить заявку на новый регион в keys.so.

Напомню, сейчас у нас есть базы по регионам Москва (lr=213) и Санкт-Петербург (lr=2). Сейчас готовятся к публикации регионы Киев и Екатеринбург.

zenja:
английскую базу планируете делать?

В перспективе - вероятно, но это вопрос не ближайших двух месяцев

FES:
Взял полный тариф на 2 месяца. По ощущению база лучше и нету мусора как в Спайвордсе и других…
Скажите Google есть в планах?

Пока хотим наиболее плотно проанализировать Яндекс, Гугл в чуть более отдаленных планах.

А про базу - спасибо, мы действительно очень старались.

c3po:
Скажем, если пользователь захочет сравнить данные за текущий период с предустановленным диапазоном дат или захочет задать собственный диапазон дат для сравнения. Текущий месяц с прошлым и так далее.

Если данные у вас перезаписываются, то не сравнить получается.

Да, посмотреть динамику изменений через keys.so на данный момент не получится. Возможно позже появится такой функционал

c3po:
Как считаете видимость?

Умножаем фразовую частотность на коэффициент позиции, суммируем для всех ключей в топ10

c3po:
Как считаете трафик (особенно интересно, картинка не точная. Возможно мне не везло и на каких-то сайтах можно увидеть другой порядок)?

Берем полученную в прошлом шаге видимость и умножаем на коэффициент, полученный эмпирическим путем. Брали сотни сайтов с открытой статсой лиру и подгоняли нашу видимость под их трафик с Яндекса. Полученный коэффициент зафиксировали. Обычно число оказывается адекватным для сайтов с трафиком от 500 уников в день, чем больше трафика тем в среднем лучше попадание. Но это только трафик с Яндекса, гадать о typein-трафике или о трафике с Гугла по позициям в Яндексе мы не решаемся.

c3po:
Какой период сканирования выдачи: раз в неделю/месяц?

У нас несколько регионов, планируем постоянное сканирование, но в один момент времени - один регион. Будет несколько "крупных" регионов - Москва, Петербург, еще некоторые. И несколько более мелких регионов. Для крупных регионов будет полная база ключей и сканирование не реже раза в два месяца (будем стараться подойти к одному месяцу), для небольших - уменьшенная база запросов и сканирование не реже раза в квартал (будем стараться подойти к двум месяцам)

c3po:
Какой период сканирования рекламы (Директ): раз в неделю/месяц?

Вместе с выдачей

c3po:
Сканирование идет сразу по всему массиву запросов или частями?

Один регион в один проход. Занимает от начала до конца несколько дней.

c3po:
Какой объем HDD у вас на сервере?

У нас несколько серверов, несколько видов железа, мои любимые - 4*800 ssd в megaraid с 1gb кеша, но наверно от них откажемся.

c3po:
Сколько времени вы храните данные?
Спасибо.

Тут не очень понял. Данные у нас разные и срок жизни у них разный. То, что обновится - оно замещается, если завтра какой то из доменов исчезнет из выдачи, то keys.so о нем забудет после полного круга обновлений всех регионов, при условии, что ни по одному ключу, ни для одного региона этот сайт не встретится. А если Вы у нас зарегистрируетесь, то, я надеюсь, мы это будем помнить вечно, в противном случае - накажем виновных.

Попробуйте еще www.keys.so - в три раза больше ключей - больше шансов найти нужное.

Вот я об этом и говорю, да, 1.4 млрд подсказок. Автогенеренных яндексом подсказок. По ту сторону браузера работает грубо говоря навороченный и подслащенный бигдатой аналог цепи Маркова, каждый раз считающий, что вероятность следующего слова в веденном тексте вот такая то, поэтому предложим ка мы это в подсказку. Вот смотрите, ценный ключ в подсказке http://clip2net.com/s/3iCtOyl

Предлагаю просто сделать в базе на 1.4 млрд, на 3.2 или там 8.45млрд ключей все ту же выборку - по слову линолеум. Если проэкстраполировать данные моей базы и базы Пастухова на объем в 1.4 млрд, то мы можно предположить, что найдется примерно 160-180к ключей с вхождением слова "линолеум". Что вы с ними делать будете? Вы их так же скормите в Кейколлектор или какой нить аналог, потратите больше аккаунтов директа и запросов на ********е, так же просеете и на выходе получите все те же 3к +- 15-20% ключей с "!частотностью" от 10. От того, что вы знаете больше ключей, в сети не стало больше людей, интересующихся линолеумом. Думаю, абсолютное большинство всех нужных ключей выловятся на базе уже в 20 млн. Да что там 20 - вон спайвордс какой бизнес поднял на базе в 12 млн из которых четверть не имеет частотности.

И конечно я не заставляю покупать мою базу или признавать ее исключительность, если считаете, что обновления для недоступного более источника данных нужны - ок, значит нам не по пути.

Просто есть данность - основная ценность в ключах из метрики, потому что это реальные переходы, потому что это реальные данные и более источник знаний о новых ключах по этому каналу недоступен. Метрика закрыла счетчики. У аналитикса эти данные никогда и небыли открыты, от лиру тоже толку немного, т.к. оба поисковика все шифруют. Как вы предлагаете обновлять данные о реальных переходах?

В МОАБе на мой взгляд так же ценность именно в метриковой части, я даже больше скажу, круто парни, выгрести столько - это действительно классно и если вы доделаете работу - снимете частотности например или каким то другим образом реализуете возможность определения популярности слова, то ваша база заиграет новыми красками.

юни:
Ну, к примеру, у MOAB'а таких вопросов не возникает.

Юни, при всем уважении, Вы вот это прочитали?

cheboor:
Вливать запросы из прямого эфира или из вордстата я определенно не буду, т.к. там слишком много мусора.

Простой пример. Делаем сайт про напольные покрытия, придумали слово линолеум. Нам все же нужен трафик, а не просто набор ключей, поэтому ставим рамки (хоть и жутко широкие) - берем в работу только ключи с "!частотностью" от 10 (все что ниже, согласитесь, слабо пойдет для формата контентника, да и в коммерцию в целом тоже).

Есть база Пастухова, которая 1млрд примерно, есть моя - 90млн. Делаем выборку по запросу линолеум, из Пастухова получается порядка 80к ключей с вхождениями, у меня - 20к, мою можно отфильтровать по частотности (частотность есть для всех ключей и она адекватна). Фильтруем - берем в работу только те, что имеют обычную частотность от 10, остается 8к ключей. И первое (80к из Пастухова) и второе (8к из моей) загружаем в КейКоллектор, чекаем. Что мы получаем на выходе? 2.88к ключей при фильтре на "!частотность" от 10 в моей базе и 3,51к - в базе Пастухова.

Проверок ровно в 10 раз меньше, результат отличается на 18% (моя база "проигрывает"). Но есть одно но - в моей базе только один источник потенциального мусора - спайвордс (от него уникальных запросов - всего 6,8млн, остальное встречалось в метрике и саджестах) и его можно отфильтровать добавив параметр в запрос, все остальные ключи - это ключи, где были реальные переходы, а не "линолеум купить линолеум" или "руками линолеум уложить своими". Если поднять фильтры и оставлять не от "!">=10, а от 30, то моя база показывает 1224 ключа, база Пастухова - 1405 (разрыв сократился до 13% и сократится еще, если ужесточить условия).

Надо ли превращать текущую базу в очередное "все на свете"? У меня ответ однозначный - нет. Благо предложений "все на свете" море - Пастухов, МОАБ, bunyatov, Букварикс (кстати оч классные ребята). Я в своей базе считаю 60% запросов мусором. Вот реально, какой смысл в ключах, если базовая частотность у них ниже 30? Да, есть тематики уровня "купить электрический вилочный погрузчик" где каждый ключ, каждый показ на вес золота, но будем реалистами, почти весь наш реальный интерес простирается в других нишах. И я бы очень порадовался возможности покупки, например, МОАБа с пробитой частотностью, но проблема в том, что это невозможно. Ну или я просто не знаю способов снять частотность для 3.2млрд ключей, даже для 100млн ключей это была не самая простая задача.

Как то так.

Всего: 407