Bukvarix

Bukvarix
Рейтинг
134
Регистрация
27.02.2013
asp1rin76:
Простите за не четкое изложение мыслей)))) Речь не о сезонности, а о точном запросе "!слово". Данные ЯВ и вашей программы сильно отличаются даже для несезонных запросов. Возьмите, для примера, Сколько должен спать ребенок в 2 месяца.

---------- Добавлено 15.07.2016 в 13:25 ----------

Вы правы, ЯВ при проверке истории не поддерживает операторы, но тренд отчетливо можно увидеть

Давайте возьмем для примера приведенное вами словосочетание "Сколько должен спать ребенок в 2 месяца" и проверим на соответствие данные Букварикс и Вордстат.

1. Ищем словосочетание "Сколько должен спать ребенок в 2 месяца" в Bukvarix 2.1. В результатах поиска видно, что широкая частотность - 1107 и "!точная !частотность" - 561 раз.

2. Поскольку в истории Вордстат не поддерживаются операторы поиска, то можно проверить только широкую частотность. Открываем YW, переходим на историю и ищем "Сколько должен спать ребенок в 2 месяца". Значение для апреля - 1083, а для мая - 1151. Значение в Буквариксе - 1107, т.е. оно попадает в интервал конец апреля - май (в это время собирались данные для обновления Букварикса).

Обратите внимание на значение июня - 1992 раза, на графике особенно хорошо видно, что данные собирались в период сильной "просадки" этого запроса, но почему этот запрос просел именно в марте - мае, вопрос все-таки не к нам :)

Для такого и подобных случаев можно очень быстро собрать предварительный список в Буквариксе и дозапросить текущие частотности с помощью Key Collector, мы обычно рекомендуем делать это для сезонных запросов и новинок. К тому же, если вы будете дозапрашивать данные с помощью Key Collector, то можно дополнительно запросить показатель годового прогноза Yandex.Direct - это нивелирует разницу по месяцам.

sysboss:
Маленький вопрос от ооочень давнего пользователя))) Когда хоть приблизительно ждать тестовую онлайн версию? Жуть как хочется перебраться под osx или еще лучше linux по максимуму!!! )))

Очень приятно, что вы о нас помните и интересуетесь развитием нашего продукта :) Мы уже несколько раз переносили сроки, поэтому сейчас лучше воздержимся от точных дат, чтобы не вводить в заблуждение. Можем только сказать что хотим выпустить ещё одно-два обновления десктопной базы (частотности и новые слова), ну а уже потом рассчитываем сделать доступной онлайн-версию.

Как только нам будет что показать, напишем в теме, и желающие участвовать в бета-тесте смогут посмотреть Букварикс онлайн чуть раньше, чем остальные :)

asp1rin76:
правильно ли я понимаю, что в версии 2.1 сезонность не учитывается? ее не посмотреть?
asp1rin76:
Проверил несколько ключей разных тематик, с вордстатом совсем не бьется.... В чем дело?

Что вы подразумеваете под учетом сезонности? В текущей базе нет трендов, которые могли бы помочь с сезонными запросами. В текущей базе частотности, как вы совершенно правильно цитируете, запрошены с конца апреля по май этого года и они, естественно, не могут совпадать со значениями Вордстат, которые вы запрашиваете сейчас, особенно для сезонных ключей.

asp1rin76:
Сделал проверку еще по ряду не сезонных ключей, данные вашей программы даже близко не подходят... Скажу больше, я учел дату вашей "выгрузки/парсинга" и сравнивал с данными ЯВ историей запросов, разница существенная, где то в 2 раза и более..
Этот факт ставит под сомнение достоверность данных по "!", но подойдет как исходник ключей для дальнейшего анализа

Как именно вы сравнивали данные "!точного !поиска" в истории ЯВ? Дело в том, что в истории ЯВ операторы не поддерживаются, см. скриншот.

Мы действительно полностью обновляем наши даные в те сроки, о которых мы пишем, мы не обманываем.

Redbaron_chaos:
Bukvarix, а можно как то выборки по EN получить (определенной тематики)? Без скачивания базы. Пусть и за денежку.

Если у вас уже есть список слов, то мы можем сделать вам выборку по нему совершенно бесплатно, только не сразу - нам понадобится время, чтобы поднять базу из архива. Если вы выберете этот вариант, пришлите список в личку.

Если же у вас есть только тематика, и нужно провести дополнительное исследование для получения списка слов, то, возможно, вам поможет кто-то из форумчан, у кого есть наша база и кто может сделать это за деньги. У нас на этом форуме есть тема, посвященная английской базе, можно попробовать спросить в ней: /ru/forum/927172

Brovik:
привет, это нормально когда импорт в базу расширенной версии EN базы длится больше 2 часов? А то вот смотрю и думаю не подвисло ли оно....

UPD: нет, судя по медленно исчезающему месту на жестком еще работает, но уже 2 часа 20 минут импорт идет...
Надо будет этот TXT файлик кому-то на рабочий стол слить и изменить название на "не открывать"

Минимальная база импортируется в среднем за полчаса, импорт расширенной может занять и более двух часов (поскольку зависимость в этом случае не линейная), а максимальная может импортироваться и сутки.

Рекомендуем вам подождать еще пару часов и если импорт не завершится по прошествии четырех-пяти часов, тогда проверьте настройки конфигурационного файла postgresql.conf (возможно, вы его обновили, но не перезапустили сервер). Убедитесь, что вы успешно обновили конфигурационный файл, и импорт выполняется с новыми настройками, это очень важно, потому что конфигурация по умолчанию (до обновления) обеспечивает очень медленный процесс импорта данных.

pro_web:
Здравствуйте! Позвольте поинтересоваться: собственно для чего нужна эта база ? и где ее применяют ?

Здравствуйте,

База пригодится для составления первоначального списка слов, который затем можно уточнить дозапросив частотности и выдачу Google.

rudireg,

Судя по сообщению об ошибке, архив скачался битым. Воспользуйтесь торрентом (у него есть механизм докачки недостающих фрагментов), перехешируйте раздачу и докачайте архив.

Можно также попробовать протестировать архив и докачать только поврежденные части. Мы рекомендуем тестировать архив с помощью WinRar, который точно определит, какие части скачались поврежденными (большинство других архиваторов указывают первую обнаруженную поврежденную часть).

Мы выкладываем для скачивания только целостные оттестированные архивы и обязательно потом проверяем уже подгруженные архивы. Все одноименные части архива из разных источников, которые мы даем для скачивания, взаимозаменяемы.

jang, vaf76,

Большое спасибо за хорошие отзывы! :)

kivlar29:
Это шутка такая или реально столько весит?

Действительно 28,6 ГБ в архиве и 103 ГБ в распакованном виде, поскольку это большая база (включающая частотности Вордстат) с готовыми индексами.

Обновилась бесплатная база рекламных объявлений Яндекс.Директ, количество объявлений в базе выросло почти в 2 раза (с 23 млн. до 44 млн. рекламных объявлений). Полный период сбора базы - конец апреля - первая половина июня 2016 года.

Текущие характеристики базы:

Уникальных объявлений: 44 627 164
Уникальных тайтлов: 25 100 957
Уникальных текстов: 17 145 532
Уникальных доменов: 392 473

База по прежнему бесплатна, доступна в двух форматах: .csv (для импорта в свою базу) и .db (для работы с оболочкой).

Если вы работаете с базой через оболочку, то для обновления достаточно распаковать новый файл YandexAds.db и переписать его поверх старого.

Скачать, а также узнать подробности о базе и ознакомиться с инструкцией по использованию оболочки можно здесь:

http://www.bukvarix.com/ad-bases.html

phoenix555:
Bukvarix, скажите, в актуальной версии данные по частотам собраны в каком месяце?

Данные по частотностям для версии 2.1 запрошены в период конец апреля - май этого года.

phoenix555:
Скачал программу, подбирать ключи действительно быстро и удобно.

Bukvarix, скажите, где включить годовые тренды, как на скрине в стартовом посте? Что-то я не нашёл.

Скрин был сделан для версии 1.1, которая до сих пор доступна для скачивания на сайте, но данные в версии 1.1. не обновляются. Запросить годовые тренды стало сложно и дорого, особенно при том, что база выросла в три раза. В новых версиях мы поддерживаем и обновляем слова и частотности Вордстат двух видов.

Всего: 641