Приведем пример.
У вас есть список словосочетаний, полностью согласованных и построенных по правилам русского языка, т.е. в виде, например, "офис в центре города", а не в виде "офис центр город". Ваша задача расширить этот список, т.е. получить больше словосочетаний с этими словами.
Если искать словосочетания без включения настройки "Игнорировать слова при поиске" (а список игнорируемых слов включает в себя служебные части речи, т.е. предлоги, частицы, союзы), то Букварикс будет искать фразы, в которых есть все четыре слова, т.е. "офис", "в", "центр" и "город".
А если включить настройку, то будут находиться вхождения с тремя словами - "офис", "центр" и "город", что даст вам более разнообразную выборку. Т.е. зачастую удобнее, когда служебные части при поиске игнорируются.
Усложнение синтаксиса запросов к нашей базе планируется, но не на ближайшее время и только в онлайн-версии. Оно необязательно будет пересекаться с операторами Яндекса.
Если вы имеете в виду запрос у Яндекса частотностей "слово1 слово2", !слово1 !слово2 и [слово1 слово2] и их комбинации, то сейчас мы запрашивем только частотности двух типов: 1) вообще без операторов поиска и 2) "!слово1 !слово2" (точные словоформы с нефиксированным порядком слов). Запросы других вариантов частотностей пока не планируются.
Во многих случаях (кроме абсолютных новинок с быстрорастущим спросом) Букварикс действительно найдет больше слов, потому что он не ограничен по количеству выдаваемых слов в отличие от Вордстата. Букварикс показывает все, то есть в базе. По каким критериям Вордстат формирует свои данные, мы точно не знаем, можем только предполагать, что это самые частотные фразы. Что касается значений частотности, то мы их получаем из Вордстата, поэтому расхождения объясняются только временным лагом.
Вирусов точно нет, каждый раз перед выкладкой новой версии мы проверяем bukvarix.exe, проблем не было обнаружено ни разу. Но во время работы программа создает много временных файлов, что скорее всего кажется подозрительным антивируснику.
Вот ссылка на последний отчет на VirusTotal:
https://virustotal.com/en/file/6943ccc388df3464595ec90696a226421484bccedb24bf9364c615fc869bea53/analysis/1488232453/
Оболочку программы можно скачать отдельно с нашего сайта, выберите из списка ту версию оболочки, которая соответствует оставшейся базе:
http://www.bukvarix.com/updates.html
Здравствуйте, Коач,
Причин несовпадения может быть несколько, но основные две сводятся к следующему:
1) Выдача Яндекса была запрошена со второй половины февраля по первую половину марта с. г., с тех пор данные могли частично поменяться.
2) Для указанного вами примера мы используем параметр lr=225 (регион Россия), и запрос делаем без куки.
Ну и нельзя исключить влияния других факторов, например, алгоритма рандомизации выдачи Яндекса.
Мы ввели ограничение на количество скачиваемых результатов по двум причинам. Во-первых, чтобы наш сервер не перегружали просто так (такое может быть, если много человек одновременно запрашивают слова для больших сайтов типа vk.com, ok.ru, mail.ru и т.п.), а во-вторых, чтобы не возникало затруднений открыть файл обычным табличным редактором (в соответствии с ограничением по количеству строк в Excel). В текущей версии сервиса нет возможности скачать больше, чем 1 млн. результатов. В будущем мы проанализируем, насколько реально будет давать возможность скачать больше.
В базу рекламных объявлений (с началом сбора в октябре 2016 г.) добавлены объявления, собранные в феврале-марте 2017 г.
Характеристики базы:
Уникальных объявлений: 67 821 730
Уникальных заголовков: 32 432 367
Уникальных текстов: 21 467 523
Уникальных доменов: 562 923
В архиве:
YandexAdsCSV.rar - 594 MB
YandexAdsDB.rar - 1,70 GB
В распакованном виде:
YandexAds.csv - 11,7 GB
YandexAds.db - 18,2 GB
Скачать базу рекламных объявлений:
http://www.bukvarix.com/ad-bases.html
Показывать адрес страницы сайта, которая найдена по ключевому слову, у нас в планах, но прямо сейчас мы к этому не готовы, это связано с некторыми технологическими моментами, которые решаются, но не сразу, мы это сделаем позже.
Вы, наверное, имеете в виду выявление новых конкурентов, о которых вы, возможно, не знаете. А как вы предполагаете искать, по домену (т.е. за основу поиска будет взят список слов указанного домена) или по введенному списку слов?
Если предельно кратко, то Букварикс скорее дополнит ваш метод, но не заменит полностью КК.
Подробнее: при сборе ключевых слов Букварикс также делает несколько итераций, но парсит подсказки Яндекса (для разных регионов), Google, Mail.ru. Сбор семантики и обновление частотностей происходят параллельно примерно в течение полутора месяцев. В сравнении с KK Букварикс удобен тем, что мгновенно найдет и покажет вам такое количество слов с частотностями, на которое КК нужно несколько часов, но, возможно, в списке не будет самых последних вариантов запросов и частотность будет также не самая актуальная (в Буквариксе частотности для региона "Весь мир").
Поэтому мы советуем сделать быстрый предварительный список слов в Буквариксе, а затем обновлять его через КК.
Повторить то же под Гугл крайне сложно. Сбор и обновление частотностей даже для небольшой базы - это проблема. Добавление Гугла у нас есть в планах, но довольно отдаленных. Для этого нужно, как минимум, много времени на исследования.
И вам спасибо за то, что пользуетесь :)
Мы как раз работаем над подобным отчетом (когда сравнивается несколько доменов и можно получить ключевые слова сразу по всем), но до конца не уверены, что сможем его сделать быстрым на нашей текущей технологии. Мы бы хотели его выпустить бесплатным и доступным для всех в бета-версии.
Если все получится удачно, то примерно через две недели он у нас появится. Если отчет не появится, то, значит, мы его отложили и вернемся к нему позже, когда будем готовы.---------- Добавлено 22.03.2017 в 14:11 ----------Еще раз всем добрый день,
Сегодня мы обновили данные в нашем веб-сервисе подбора ключевых слов по домену конкурента.
Поисковая выдача Яндекса запрашивалась во второй половине февраля - первой половине марта 2017 г.
Частотности обновлены по базе Букварикс 2.7 (собраны в период со второй половины января по февраль 2017 г.).
Размер базы, по которой запрашивалась выдача для региона "Москва", составляет 105 млн. ключевых слов.
Размер базы, по которой запрашивалась выдача для регионов "Россия", "Украина" и "Санкт-Петербург", составляет 30 млн. ключевых слов.
Адрес веб-сервиса:
http://beta.bukvarix.com/