Полная общая база слов, которую мы начали собирать в прошлом году, и которая у нас постоянно накапливается, пополняясь новыми запросами, в настоящее время составляет ~3 млрд., для нее мы как раз и запрашиваем частотности, оставляя в десктопной версии только слова с частотностями. Но такое количество слов предлагать в виде десктопной программы мы не можем из-за слишком большого размера такой базы. В онлайн решении мы подумаем, как лучше представить более полную базу с сезонными запросами.
Здравствуйте,
Мы очень благодарны вам за желание поддержать наш проект финансово, но если вы подпишетесь на наш сервис, когда он станет платным, это будет лучшим признанием и поддержкой для нас. Но и сейчас ваши теплые слова нам тоже приятны как стимул для дальнейшей работы над проектом. А пока мы продолжаем работать над полностью бесплатными обновлениями, буквально через пару дней мы анонсируем новую версию с обновленными словами и частотностями.
Раньше мы обновляли слова отдельно (добавляли новые слова), а частотности отдельно, но начиная с этой версии будем стараться синхронизировать обновление слов и частотностей. Обновление частотностей также затрагивает и слова - фразы, у которых частотности исчезают при следующем обновлении, уходят из базы. Напоминаем, что в нашей базе содержатся только те слова, для которых Вордстат вернул частотности большие или равные единице. Обычно мы добавляем десятки миллионов фраз, точно количество добавляемых фраз для каждой из версий можно посмотреть на странице версий: http://www.bukvarix.com/bukvarix-versions.html
Очень рады, что в итоге вы получили рабочую программу.
Спасибо, что оценили. Не бросим, буквально на днях ждите обновление слов и частотностей :)
А вы не могли бы уточнить, как вы распаковываете? Выбираете все тома архива и извлекаете или только первый том? (нужно нажать на первую часть архива, остальные автоматически будут подхватываться при распаковке).
В распакованном виде программа занимает 93,6 Гб, 121 Гб - это слишком много.
Мы сейчас над ней работаем, на текущий момент срок релиза не уточняем, напишем позже. Параллельно обновляем базу десктопного Букварикса, к концу этой недели будет обновленная база (слова и частотности).
Очень рады, что у вас получилось!
Когда вы добавляете слова в список как для поиска, так и исключений, никаких дополнительных символов к словам добавлять не нужно, т.е. не нужно применять синтаксис Яндекса для поиска точных форм и фраз. В вашем примере добавьте в список слов-исключений просто для, а не !для и не "!для". В таком случае отфильтруются все фразы, которые сожержат этот предлог.
Судя по скриншоту, архив поврежден - нужно перекачать битые части и снова повторить распаковку. В вашем случае лучше скачивать исключительно через торрент (поскольку там уже есть контрольные суммы, риск скачать что-то битое минимален).
Чтобы заново все не перекачивать, сделайте так:
1. Скачайте с нашего сайта .torrent файл.
2. Как только ваш торрент клиент предложит выбрать место, куда скачивать, укажите то место, где уже у вас расположен скачанный архив Букварикса (в данном случае не важно, что он частично битый).
3. Ваш торрент клиент должен начать проверку уже скачанных файлов, в случае ошибок перекачает то, что нужно.
После этого повторно распакуйте Букварикс.
Если что-то пойдет не так, напишите нам на support at bukvarix.com и опишите что не получилось - постараемся помочь.
Начиная с версии 1.2 мы поддерживаем сбор частотностей только для региона "Весь мир", поскольку Яндекс стал жестче банить, и запрос данных для всех регионов оказывается неоправданно дорогим. Мы остановились на поддержке только тех частотностей, которые наиболее востребованы и универсальны. Но если вам нужна база со всеми регионами, то она все еще доступна на нашем сайте.
Уже не в планах, а в работе, срок выхода сообщим в этой теме позже.