Добрый день,
Продолжаем подтягивать онлайн-версию Букварикса до уровня десктопной программы, и даже больше. В это раз мы вводим возможность применения настроек.
Появилась возможность настраивать три параметра:
1) Тип поиска по умолчанию теперь можно выбрать из двух вариантов:
- поиск с учетом словоформ,
- поиск без учета словоформ.
В первом случае вы получите больше словосочетаний с поисковыми словами, поскольку в результатах будут присутствовать поисковые слова в разных формах, например, существительные в различных падежах единственного и множественного числа. В случае выбора поиска без учета словоформ вы получите словосочетания с поисковыми словами в точных словоформах.
Дополнительно, хотим заметить, что поиск отдельных слов в каждом типе поиска по умолчанию можно инвертировать:
- для того, чтобы с включенным поиском с учетом словоформ слово искалось в точной словоформе, нужно поставить восклицательный знак (!) перед словом без пробела (слово1 !слово2)
- для того, чтобы с включенным поиском без учета словоформ (точным поиском) слово искалось в разных словоформах, нужно поставить знак тильды (~) перед словом без пробела (~слово1 слово2)
2) Список слов, игнорируемых при поиске, теперь можно редактировать. По умолчанию в этот список входят служебные слова, которые не учитываются при поиске. Например, если вы ищете "погода в Новосибирске", фактически сервис будет искать "погода Новосибирске". Это сделано для того, чтобы не нужно было переделывать список фраз естественного языка, убирая предлоги и союзы, но при этом получить максимум полезных фраз в выборке.
3) Точно также можно редактировать и список слов, игнорирумых при анализе. Напомним, что для удобства поиска слов, которые имеет смысл отминусовать, в простом или расширенном "Подборе слов" можно перейти из режима отчета в режим анализа. В режиме анализа вы видите список всех слов, которые встречаются в выборке, отсортированный в порядке убывания частотности. Так легко определить, какие контексты употребления поисковых слов для вас неправильные, и использовать найденные слова как минус-слова. Вместе с тем, в верхней части списка всех слов выборки часто встречаются предлоги, частицы, союзы, наречия (потому что таких употреблений много). Вы можете поместить эти слова в список для игнорирования - так они не будут затруднять просмотр списка.
Обращаем ваше внимание, что оба списка игнорируемых слов не следует путать со списками минус-слов, они предназначены для других целей.
Для того, чтобы настройки запоминались, сейчас используются куки. В дальнейшем мы добавим аккаунт, чтобы одинаковые настройки запоминались для пользователя как на рабочем, так и на домашнем компьютере.
Настроить поиск можно по адресу:
http://www.bukvarix.com/settings/
regta, непосредственно в сервисе (и программе) нет возможности убрать нечеткие дубликаты, только с помощью дополнительных скриптов/программ, как уже посоветовали (спасибо!) LEOnidUKG и one.
Разработка экспорта из онлайн версии в десктоп не планируется, но в планах есть увеличение лимитов слов в списках в онлайн-версии.
Да, так и есть - десктопная версия больше не поддерживается (но по прежнему доступна для загрузки), версия 3.0, выпущенная 1 октября - последняя.
Дальнейшее развитие Букварикса будет только для онлайн версии.
Полных дубликатов ни в онлайн-версии программы, ни в десктопной версии нет, но есть перестановки и несогласованные словосочетания, которые принято называть нечеткими или неявными дубликатами. Чистка от нечетких дубликатов у нас по-прежнему в планах, мы еще не подошли к решению этой задачи.
В Нормализаторе можно работать с разными списками, в том числе полученными не из Букварикса. Также при других преобразованиях (например, удалениях пробелов или начальных/конечных символов) можно получить полные дубликаты фраз - именно они удаляются в Нормализаторе.
Спасибо за отзыв! :)
Как мы предварительно анонсировали на прошлой неделе, мы подготовили апдейт баз Яндекс Россия, Яндекс Санкт-Петербург, а также Google Киев. Обновлена выдача, процесс обновления занял вторую половину декабря 2017 года и весь январь 2018 г.
В Нормализаторе дополнительно к возможности удалять некоторые символы в начале слов мы добавили возможность удаления символов "?", "!" и "." в конце слов в списке.
Приглашаем воспользоваться поиском слов по доменам в обновленных базах, а также улучшенным Нормализатором:
http://www.bukvarix.com/site/
http://www.bukvarix.com/normalizer/
Сегодня мы обновили данные выдачи для баз Яндекс Москва и Google Москва. Обновление проводилось с середины декабря прошлого года по конец января текущего года. База Яндекс Москва сформирована по 130 млн. уникальных поисковых запросов, а Google Москва - по 50 млн.
Выдачу в базах других регионов планируем обновить на следующей неделе.
Воспользуйтесь сервисами подбора ключевых слов по домену конкурента:
Большое спасибо за отзыв и за пожелание успеха! Мы вам также желаем всяческих успехов, в том числе и в проектах, для которых вы используете наш сервис :)
Можно. Процедура такова, что для большого количества ключевых слов, отсортированных в порядке убывания популярности, запрашивается и парсится выдача первых 50 результатов. Т.е. процесс обратный, не ключевые слова запрашиваются для домена, а домен находится по запросу наиболее популярных ключевых слов.
Если для какого-то домена слов мало, то можно предположить, что это слова, по которым конкуренция высока, и сайт за пределами первых 50 результатов, а слова, по которым сайт на высоких позициях, не очень популярны (не входят в топ 130 млн. для Яндекс Москвы). Либо сайт совсем недавно получил позиции в топ 50 по словам, в таком случае есть шанс, что в следующем апдейте вы увидите больше слов для сайта - в конце недели мы обновим базу поисковой выдачи для Москвы (Яндекс и Гугл), проверьте.
Здравствуйте,
Предлагаем три улучшения инструментов Букварикса.
1. В дополнение к Комбинатору и Нормализатору представляем еще один инструмент автоматизации работы со списками слов - Компаратор слов, который сравнивает два списка. В результате его работы вы можете получить общие для двух списков слова, объединенный список уникальных слов, увидеть разницу по каждому из списков.
2. Нормализатор дополнен возможностью удаления знаков "+", "-" и "!" в начале слов в списке. Списки с такими символами часто копируются из рекламных кампаний Яндекс.Директ, а в расширенном режиме Подбора слов Букварикса, где можно искать по спискам ключевых слов, они чаще всего не нужны.
3. В качестве еще одного полезного улучшения добавлены готовые списки слов для исключения и комбинирования. Списки перенесены из десктопного Букварикса. Особенно популярны списки с названиями городов.
Вы правы, спасибо. Нас немного оправдывает то, что новость мы пишем для "технарей", для которых такая лексика привычна :)
И это так. Пока еще непонятно, как сохранить высокую скорость этой операции при дополнительной обработке лемматизатором.