ortega3000

ortega3000
Рейтинг
32
Регистрация
11.06.2007

Чем короче шингл, тем точнее можно отловить дуп, но разница будет и не очень велика. Но это влечет за собой увеличение как используемой памяти, так и используемого времени.

Насколько я знаю, все известные в паблике программы для сравнения текстов используют шинглы длиной в 10 слов.

Друзья, рад представить вам новую версию синонимайзера 0.3.0.1

Как всегда, вы можете скачать синонимайзер с сайта программы. Там же вы сможете познакомиться с последними новостями.

Что нового в новой версии:

+ добавлен автоматический (пакетный) режим

+ добавлена программа для обновления файлов

+ полностью реализована функция работы с плагинами

+ исправлен баг, приводящий к крешу программы при создании шаблона размножения

+ исправлен баг выбора кодировки при сохранении файлов

+ исправлены другие мелкие баги

Некоторые функции в программе были улучшены, некоторые - ускорены, в целом программа стала еще более стабильной, чем раньше. Добавление пакетного режима позволит вам обрабатывать целые массивы текстовых файлов. Правда, теперь вам придется пересмотреть свои словари, оставив в них только заведомо правильные синонимы, чтобы читабельность текста не хромала.

Если у вас установлена предыдущая версия, то самым идеальным решением для вас будет переустановка программы. В этом случае у вас в меню программ появится еще одна программа для обновления состава синонимайзера. При этом перед удалением старой версии не забудьте экспортировать свой словарь в текстовый формат, а затем импортировать его обратно. Это нужно из-за того, что при деинсталляции программы ваш словарь удаляется тоже. А резервная копия еще никому не вредила.

Этот способ подойдет для не очень опытных пользователей или для тех, кому не хочется искать, где же на его диске установлен WordSyn.

Второй способ подойдет для опытных пользователей и для тех, кому не хочется терять 20 мегабайт трафика. Этот способ заключается в том, что вы скачиваете программу-апдейтер, помещаете ее в папку с вордсином, запускаете ее и нажимаете на кнопку "Загрузить обновления". Правда, при этом вам придется создать ярлык для программы-апдейтера самостоятельно.

Что стоит ждать в новых версиях программы:

  • сохранение текущего проекта ручного режима. Теперь вы сможете прерывать свою работу и возобновлять ее в любой момент.
  • расширенное управление режимом размножения
  • Генерировать массивы текстовых файлов на основе шаблона
  • Вставлять в массив сгенерированных файлов анкоры
  • Подключать словари для разных тематик
  • Использовать многословные конструкции для синонимизации и постановки в стоп-лист

Если у вас будут какие-либо пожелания по поводу добавления нового или улучшения старого функционала, пишите их здесь, либо в личку, либо в комментах на блоге.

Кстати, начиная с сегодняшнего дня стоимость коммерческой лицензии составляет 75WMZ, а некоммерческой - 15WMZ. До 22-го сентября вы можете приобрести любую из лицензий по старой цене (50 и 10 WMZ соотвественно) при условии покупки двух или более лицензий за раз.

Sdmin:
Можно поподробнее про это. 😕

Вскоре в программу будет добавлен новый функционал, который позволит генерировать статьи по созданному шаблону.

Кстати, хочу добавить, что я закончил разработку пакетного режима, во вторник его хорошенько протестирую и уже в среду утром выложу для скачивания версию 0.2.2.1

И, уже начиная со среды, стоимость лицензий будет увеличена в полтора раза: коммерческая будет стоить 75WMZ, а некоммерческая - 15WMZ. Поэтому если вы планируете перейти на коммерческую лицензию, делайте это во вторник, так как со среды доплата за переход будет на 20WMZ больше.

Обо всем этом я сообщу еще раз в среду утром этой ветке, на блоге и на официальном сайте программы.

Сегодня была выложена для скачивания версия 0.2.1.8.

Что нового в этой версии:

+ в разы ускорен импорт словаря из текстового формата

+ ускорена обработка текста в ручном режиме

+ добавлено отображение прогресса текущей задачи в ручном режиме

+ ускорена замена одного синонима на другой по двойному клику

+ исправлены баги в размножителе текстов

+ добавлены дополнительные окна сообщений

+ исправлены некоторые мелкие баги

+ проверка на похожесть текстов вынесена в подзадачу и не выполняется автоматически

Архив с инсталлятором был обновлен, а обновление для программы залито отдельно. Если у вас более старая версия, вы можете обновить программу с помощью пункта меню Файл->Проверить обновление. Не забудьте, что после обновления программу надо перезапустить ДВА раза. Этот баг будет исправлен уже в версии 0.2.2.0, так как он требует достаточно серьезной перестройки приложения.

Все пожелания, как всегда, принимаются по всем доступным каналам связи.

Похоже, ошибка заключается в том, что при поиске слова программа берет только одно слово из всех вариантов. Так, слово души она воспринимает как слово душ в множественном числе. Проблема использования нескольких базовых форм слова заключается в том, что каждый системный синоним имеет свой идентификатор, и при добавлении синонима не будет понятно, к какому базовому слову этот синоним должен быть прикреплен. В общем-то, у меня есть задумки по этому поводу, и можно будет решить эту проблему. Правда, при этом в контекстном меню для слов с несколькими вариантами базовых слов вместо слова в верхнем левом углу будет выпадающий список с перечнем всех базовых слов текущего слова. Естественно, что управление при этом несколько усложнится.

monte:
я уже писал о этой проблеме.

автоматическое добавление в персональный словарь незнакомых слов с пустыми значениями влечёт за собой путаницу в последствии.
система начинает путать слова типо:
душа
души
душой

видит одно слово, синоним берёт из другого, показывает в синонимах к слову третее и так просто не удаляется.
чтоб удалить мешанину, приходится идти в модус редактора словарей, искать и просматривать все слова и удалять.
можно ли отключить это? и добавлять в словарь только то, что я хочу, а не всё подрят.

Вы не могли бы привести в качестве примера то слово, которое вы добавляете вручную и которое вызывает путаницу? В общем я представляю отчего это происходит, но мне надо проверить на живом примере.

Итак, наконец-то работа над коммерческим словарем закончена. Я благодарен всем добровольцам, взявшим участие в работе над словарем. Просьба, если я кого-то из добровольцев пропущу в аське, постучитесь ко мне сами для получения полной версии.

Теперь более подробно о том, что есть.

В настоящий момент есть две версии словаря: коммерческая и полукоммерческая.

Коммерческая версия основана на 5000 высокочастотных словах, покрывающих 80-90% среднестатистических текстов. Статистика не моя, вы сами можете нарыть информацию об этом в инете. Всего в словаре 5658 слов с наиболее употребимыми синонимами.

Словарь будет полезен тем, кто собирается обрабатывать тексты в полуавтоматическом и автоматическом режиме.

Стоимость словаря 25WMZ. Владельцы коммерческих лицензий могут получить словарь бесплатно.

Полукоммерческая версия словаря содержит 30 тысяч слов, имеющих ВСЕ возможные синонимы. Это значит, что кроме наиболее употребимых синонимов в нем есть редкие (воздаяние) и семантические (женщина=щель) синонимы, а также грубые слова (зад=ж@па) и арго (друг=кореш, пить=бухать). По моей оценке словарь покрывает 95-98% любого текста (за исключением редких слов, предлогов, междометий, частиц, собственных имен и названий и специальных терминов).

Словарь может быть полезен тем, кто занимается ручной литературной обработкой текстов и для кого нужен полный список синонимов для большинства слов.

Стоимость словаря 20 WMZ. Владельцы коммерческих лицензий могут получить словарь бесплатно.

Оба словаря доступны как в текстовом так и в скомпилированном виде. Первый вариант может быть полезен тем, кто захочет просмотреть (и, возможно, подправить) состав словаря перед его импортом. Второй вариант хорош тем, что для подключения данного словаря нужно просто поместить его в папку с программой.

По любым вопросам относительно данных словарей обращайтесь в аську 1659776 или с помощью формы обратной связи на блоге (в подписи).

ortega3000 добавил 08.09.2008 в 14:45

Забыл добавить, что покупка двух словарей сразу обойдется вам всего в 35wmz.

DmitryShustov:
ТС ваш софт стоит объявленных денег

Пытаетесь меня задеть? Не стоит, я давно уже не ведусь на подобные замечания.

Но все равно спасибо.

Кстати, у меня уже есть группа заказчиков, которые рады получить хороший продукт за такие (крошечные) деньги. И которые уже используют его и зарабатывают на этом деньги. И они не стыдятся признать хорошим и похвалить такой дешевый продукт.

DmitryShustov:
>Что он еще должен уметь делать, кроме синонимизации?

НИЧЕГО! Кроме качественной синонимизации, я качества не увидел пока. Там где видел - купить нереально софтинку ))

Был и на сайте вашем и на блоге - ничего интересного там не увидел, увы.

За качество нужно платить. Вы готовы заплатить за качественную синонимизацию 10к зелени? Думаю, что нет. А ведь примерно столько стоит синонимайзер, который умеет делать это сверхкачественно. И я не думаю, что названная мною цена отличается от реальной хотя бы в два раза. Если бы программу писала команда из 10 разработчиков, то, конечно, она была бы куколкой. Но и стоила бы соответственно.

Знаете, что самое неприятное в оценке программ? В том, что мы забываем, что они избавляют нас от рутинных операций, делая черновую работу, экономя нам время, которое стоит очень дорого, так как является невосполнимым ресурсом.

В общем, каждый выбирает инструмент под себя. То ли это бесплатный вордпад, то ли платный ворд.

Посмотрите в сторону WGet - он с открытыми кодами, под никсы и работает как краулер.

http://ftp.gnu.org/gnu/wget/

Всего: 200