Рассмотрите keys.so
Следом можете прислать адрес сайта на info@keys.so и мы подготовим тестовый отчет для Вас. Уверен, у нас данных больше, чем у любого сервиса на рынке.
О нас начали появляться посты в блогах, два последних:
http://adne.info/porybachim
http://spryt.ru/keys-so/
Для последнего записали мини-ролик о работе сервиса, им бы мне и хотелось поделиться в данной ветке
Если у вас возникли вопросы по работе сервиса? буду рад на них ответить. Всегда открыты к предложениям, например, Вы можете оставить заявку на новый регион в keys.so.
Напомню, сейчас у нас есть базы по регионам Москва (lr=213) и Санкт-Петербург (lr=2). Сейчас готовятся к публикации регионы Киев и Екатеринбург.
В перспективе - вероятно, но это вопрос не ближайших двух месяцев
Пока хотим наиболее плотно проанализировать Яндекс, Гугл в чуть более отдаленных планах.
А про базу - спасибо, мы действительно очень старались.
Да, посмотреть динамику изменений через keys.so на данный момент не получится. Возможно позже появится такой функционал
Умножаем фразовую частотность на коэффициент позиции, суммируем для всех ключей в топ10
Берем полученную в прошлом шаге видимость и умножаем на коэффициент, полученный эмпирическим путем. Брали сотни сайтов с открытой статсой лиру и подгоняли нашу видимость под их трафик с Яндекса. Полученный коэффициент зафиксировали. Обычно число оказывается адекватным для сайтов с трафиком от 500 уников в день, чем больше трафика тем в среднем лучше попадание. Но это только трафик с Яндекса, гадать о typein-трафике или о трафике с Гугла по позициям в Яндексе мы не решаемся.
У нас несколько регионов, планируем постоянное сканирование, но в один момент времени - один регион. Будет несколько "крупных" регионов - Москва, Петербург, еще некоторые. И несколько более мелких регионов. Для крупных регионов будет полная база ключей и сканирование не реже раза в два месяца (будем стараться подойти к одному месяцу), для небольших - уменьшенная база запросов и сканирование не реже раза в квартал (будем стараться подойти к двум месяцам)
Вместе с выдачей
Один регион в один проход. Занимает от начала до конца несколько дней.
У нас несколько серверов, несколько видов железа, мои любимые - 4*800 ssd в megaraid с 1gb кеша, но наверно от них откажемся.
Тут не очень понял. Данные у нас разные и срок жизни у них разный. То, что обновится - оно замещается, если завтра какой то из доменов исчезнет из выдачи, то keys.so о нем забудет после полного круга обновлений всех регионов, при условии, что ни по одному ключу, ни для одного региона этот сайт не встретится. А если Вы у нас зарегистрируетесь, то, я надеюсь, мы это будем помнить вечно, в противном случае - накажем виновных.
Попробуйте еще www.keys.so - в три раза больше ключей - больше шансов найти нужное.
Вот я об этом и говорю, да, 1.4 млрд подсказок. Автогенеренных яндексом подсказок. По ту сторону браузера работает грубо говоря навороченный и подслащенный бигдатой аналог цепи Маркова, каждый раз считающий, что вероятность следующего слова в веденном тексте вот такая то, поэтому предложим ка мы это в подсказку. Вот смотрите, ценный ключ в подсказке http://clip2net.com/s/3iCtOyl
Предлагаю просто сделать в базе на 1.4 млрд, на 3.2 или там 8.45млрд ключей все ту же выборку - по слову линолеум. Если проэкстраполировать данные моей базы и базы Пастухова на объем в 1.4 млрд, то мы можно предположить, что найдется примерно 160-180к ключей с вхождением слова "линолеум". Что вы с ними делать будете? Вы их так же скормите в Кейколлектор или какой нить аналог, потратите больше аккаунтов директа и запросов на ********е, так же просеете и на выходе получите все те же 3к +- 15-20% ключей с "!частотностью" от 10. От того, что вы знаете больше ключей, в сети не стало больше людей, интересующихся линолеумом. Думаю, абсолютное большинство всех нужных ключей выловятся на базе уже в 20 млн. Да что там 20 - вон спайвордс какой бизнес поднял на базе в 12 млн из которых четверть не имеет частотности.
И конечно я не заставляю покупать мою базу или признавать ее исключительность, если считаете, что обновления для недоступного более источника данных нужны - ок, значит нам не по пути.
Просто есть данность - основная ценность в ключах из метрики, потому что это реальные переходы, потому что это реальные данные и более источник знаний о новых ключах по этому каналу недоступен. Метрика закрыла счетчики. У аналитикса эти данные никогда и небыли открыты, от лиру тоже толку немного, т.к. оба поисковика все шифруют. Как вы предлагаете обновлять данные о реальных переходах?
В МОАБе на мой взгляд так же ценность именно в метриковой части, я даже больше скажу, круто парни, выгрести столько - это действительно классно и если вы доделаете работу - снимете частотности например или каким то другим образом реализуете возможность определения популярности слова, то ваша база заиграет новыми красками.
Юни, при всем уважении, Вы вот это прочитали?
Простой пример. Делаем сайт про напольные покрытия, придумали слово линолеум. Нам все же нужен трафик, а не просто набор ключей, поэтому ставим рамки (хоть и жутко широкие) - берем в работу только ключи с "!частотностью" от 10 (все что ниже, согласитесь, слабо пойдет для формата контентника, да и в коммерцию в целом тоже).
Есть база Пастухова, которая 1млрд примерно, есть моя - 90млн. Делаем выборку по запросу линолеум, из Пастухова получается порядка 80к ключей с вхождениями, у меня - 20к, мою можно отфильтровать по частотности (частотность есть для всех ключей и она адекватна). Фильтруем - берем в работу только те, что имеют обычную частотность от 10, остается 8к ключей. И первое (80к из Пастухова) и второе (8к из моей) загружаем в КейКоллектор, чекаем. Что мы получаем на выходе? 2.88к ключей при фильтре на "!частотность" от 10 в моей базе и 3,51к - в базе Пастухова.
Проверок ровно в 10 раз меньше, результат отличается на 18% (моя база "проигрывает"). Но есть одно но - в моей базе только один источник потенциального мусора - спайвордс (от него уникальных запросов - всего 6,8млн, остальное встречалось в метрике и саджестах) и его можно отфильтровать добавив параметр в запрос, все остальные ключи - это ключи, где были реальные переходы, а не "линолеум купить линолеум" или "руками линолеум уложить своими". Если поднять фильтры и оставлять не от "!">=10, а от 30, то моя база показывает 1224 ключа, база Пастухова - 1405 (разрыв сократился до 13% и сократится еще, если ужесточить условия).
Надо ли превращать текущую базу в очередное "все на свете"? У меня ответ однозначный - нет. Благо предложений "все на свете" море - Пастухов, МОАБ, bunyatov, Букварикс (кстати оч классные ребята). Я в своей базе считаю 60% запросов мусором. Вот реально, какой смысл в ключах, если базовая частотность у них ниже 30? Да, есть тематики уровня "купить электрический вилочный погрузчик" где каждый ключ, каждый показ на вес золота, но будем реалистами, почти весь наш реальный интерес простирается в других нишах. И я бы очень порадовался возможности покупки, например, МОАБа с пробитой частотностью, но проблема в том, что это невозможно. Ну или я просто не знаю способов снять частотность для 3.2млрд ключей, даже для 100млн ключей это была не самая простая задача.
Как то так.