Hkey Auto Synomazer вышел!

vtomas
На сайте с 19.03.2007
Offline
102
#211

У меня с режим генератора подглючивает. Добавляю слово из списка синонимов, получаю конструкцию {слово|слово2}, иду дальше по тексту, добавляю следующую конструкцию, перехожу к следующему слову, конструкция автоматом сама вставляется. Это происходит со словами которые не заключены ни в одну конструкцию.

Хорошее стоит дорого, на плохое не стоит и тратиться. В поисках VPS захостился здесь (http://ipserver.su), а бэкапы храню здесь (http://billing.markovservers.com/backup/pl.php?65).
Hkey
На сайте с 30.09.2006
Offline
222
#212
mrr:
До этого новые версии копировал в старую папку с перезаписью файлов. Такой опции в меню не было. Сейчас додумался тот же архив распаковать в новую папку и запустить и ... о чудо ... опция появилась :)
Пишу для остальных, чтобы знали что делать, если не могут найти нужную опцию.
Hkey, спасибо, работает на отлично.

В 1.0 версии будет установщик и автоапдейт. Пока это не в приоритете.

В следующей версии 0.8 планирую:


1. Увеличить скорость работы раз в 5, а для больших файлов в 10тки раз. 95-99% программа считает пересечения замен и их конкуренцию. Остальное время программа занята разбиванием строк для строковых замен и подсчетом контрольных сумм. И только меньше десятой доли процента времени программа производит склонения, опознавание слов и операции WS.
2. Увеличить возможности работы с числами. Сейчас программа может преобразовывать цифровую запись (123) в пропись (числительное - "сто двадцать три" и числительное-прилагательное - "сто двадцать третий" и склонять эти сложные числительные). Кроме того она понимает согласованность существительных, прилагательных и других частей речи имеющих падеж и род с цифрами и числительными (1 рубль, 2 рубля, 5 рублей).
Например, замена
W1::<тип=цифры> W2::<чр=с, цсогл_им=w1>%W1::<чр=числ, род=w2> W2::<>

Преобразует

"201 рубль" в "двести один рубль"
"202 рубля" в "двести два рубля"
"205 рублей" в "двести пять рублей"
"201 копейка" в "двести одна копейка"

Однако
"201 рубля" не будет преобразовано, поскольку они не согласуются в именительном падеже.
Распишу словами замену
W1::<тип=цифры> W2::<чр=с, цсогл_им=w1>%W1::<часть_речи=числ, род=w2> W2::<>

Замена ищет группу из двух слов. При этом первое слово это целое число (тип=цифры). Второе число существительное (чр=с) согласовано с этим числом (цсогл_им=w1) по правилам согласования существительных с числительными русского языка. Группа имеет именительный падеж(цсогл_им=w1). Однако, ни одно из слов может не быть (и в большинстве случаев не будет) в этом падеже. Такой вот курьез русского языка. "1 рубль", "2 рубля", ..., "5 рублей". Слово рубль только один раз в именительном падеже, хотя он везде подразумевается. Например слово "рубля" в родительном падеже, однако группа слов "2 рубля" имеет именительный падеж, а в родительном будет "2 рублей" (около 2 рублей). Русский язык довольно сложный, особенно если его объяснять словами. Если говорить по простому цсогл_им=ц1 значит согласуются ли эти два слова и должно ли первое из них иметь именительный падеж.
Теперь какие преобразования в этой замене происходят. Первое слово переходит в числительное (часть_речи=числ) т.е. записывается прописью. Потом его род преобразуется в род первого слова. два рубля, две копейки

3. В позапрошлой версии появились абстрактные замены (они не привязаны к конкретным словам) переставляющие слова местами типа "отели и гостиницы" в "гостиницы и отели" - они работают при настройках самого худшего качества (--- -А). Они обрабатывают практически любую пару существительных, разделенных "и". На 1000 символов в среднем такая замена срабатывает один раз. Это очень много. Однако они часто ошибаются. Поэтому придется вводить еще один тип замен "абстрактные исключение", чтобы улучшить работу подобных замен и еще один флаг.
4. Также есть идея улучшить качество не заменяя слово на синоним, если рядом есть такое-же слово и его нельзя заменить на обратный синоним.

В версии 0.9 планирую:

1. Добавить генератор в интерфейс программы. Первый шаг к этому я сделал в этой версии.
2. Повысить неоднозначность замен. Т.е. сделать, чтобы к одному и тому-же куску в тексте было как можно больше замен. Это улучшит режим генератора и сделает обычный синомайзинг более случайным. Т.е. два пользователя с одинаковыми настройками из одного и того же текста. будут получать разные тексты. В программе появиться ползунок "качество"<->"разнообразие". В режиме генератора эта настройка повысит количество автоматных вариантов в одной {}-конструкции.
3. Добавить в программу то, о чем нельзя здесь написать из-за второго пункта правил этого раздела форума.

Hkey добавил 16.12.2009 в 22:18

vtomas:
У меня с режим генератора подглючивает. Добавляю слово из списка синонимов, получаю конструкцию {слово|слово2}, иду дальше по тексту, добавляю следующую конструкцию, перехожу к следующему слову, конструкция автоматом сама вставляется. Это происходит со словами которые не заключены ни в одну конструкцию.

Попробовал. Вы имеете ввиду, что если отметить галочкой синоним слова, то приходиться потом три раза нажимать кнопку "далее"?

Еще вижу еще три недоработки в режиме генератора. Если расширенный режим включен после выделение элемента открывается окно добавления синонимов к слову. Вторая, то что жирного текста слишком много - немного раздражает. Третья, что при пролистывании колесиком мыши выделяются замены.

HTraffic.ru (http://HTraffic.ru/) - удобная система для управления контекстной рекламой. тема на форуме (/ru/forum/810827) HTracer (http://htracer.ru/) - скрипт для автопродвижения сайтов по НЧ и СЧ запросам. Для больших сайтов от 100 страниц. (тема на форуме (/ru/forum/676867))
S
На сайте с 30.01.2008
Offline
44
#213

Не работает пакетная обработка файлов

обрабатывает 50-150 файлов (каждый раз по разному) и вылетает ошибка ("ошибка доступа к памяти по адресу такому то бла бла бла"). проверял как на компе (винда ХР сп3) так и на ноуте (Виста)

Хотелось бы как можно скорее получить пофиксеную версию. а то без пакетной обработки как то совсем неинтересно (((

gorynchik
На сайте с 25.05.2007
Offline
100
#214
SEOAleksey:
Не работает пакетная обработка файлов
обрабатывает 50-150 файлов (каждый раз по разному) и вылетает ошибка ("ошибка доступа к памяти по адресу такому то бла бла бла"). проверял как на компе (винда ХР сп3) так и на ноуте (Виста)

Хотелось бы как можно скорее получить пофиксеную версию. а то без пакетной обработки как то совсем неинтересно (((

Аналогично. Когда-то автору писал - он посоветовал на другой компе попробовать поставить. Я тогда забил на это дело до лучших времен.

M
На сайте с 14.01.2008
Offline
112
mrr
#215

Вы лучше сразу напишите, по какому адресу возникает ошибка, либо скрин ее скиньте автору.

Думаю, это поможет ему решить проблему.

sanitarn
На сайте с 20.08.2007
Offline
199
#216

Как часто ТС здесь бывает? ВТорой день нет ответа, может есть более быстрые контакты с ним?

финансовый ответ (https://finansanswer.ru) Займ для безработных (https://finansanswer.ru/mikrozajmy/bezrabotnym/)
gorynchik
На сайте с 25.05.2007
Offline
100
#217

В стандартной базе встречаются строки типа

", как известно," % __НУЛЛ__

",добавляет наш корреспондент," % __НУЛЛ__

"в конце концов," % __НУЛЛ__

Больше десятка таких строк.

Это типа фича такая или недоработка?

FANTiK123
На сайте с 30.12.2008
Offline
76
#218
gorynchik:
В стандартной базе встречаются строки типа

", как известно," % __НУЛЛ__
",добавляет наш корреспондент," % __НУЛЛ__
"в конце концов," % __НУЛЛ__

Больше десятка таких строк.
Это типа фича такая или недоработка?

это типа база не полная для ознакомления дается

Универсальный парсер контента для создания интернет-магазинов (http://sbfactory.ru/?p=600) и не только ;)
gorynchik
На сайте с 25.05.2007
Offline
100
#219
FANTiK123:
это типа база не полная для ознакомления дается

Не, это в купленной версии проги

Hkey
На сайте с 30.09.2006
Offline
222
#220
gorynchik:
В стандартной базе встречаются строки типа

", как известно," % __НУЛЛ__
",добавляет наш корреспондент," % __НУЛЛ__
"в конце концов," % __НУЛЛ__

Больше десятка таких строк.
Это типа фича такая или недоработка?

__НУЛЛ__ - это константа, которая означает пустую строку. Если вы просто ничего не напишите, то программа посчитает, что это исключение. Если вы пишите __НУЛЛ__, это означает, что строка удалиться. Пользователю выведется __НУЛЛ__, чтобы он видел, что произошла замена, однако при копировании или сохранении "__НУЛЛ__" удалиться.

Hkey добавил 08.01.2010 в 19:07

SEOAleksey:
Не работает пакетная обработка файлов
обрабатывает 50-150 файлов (каждый раз по разному) и вылетает ошибка ("ошибка доступа к памяти по адресу такому то бла бла бла"). проверял как на компе (винда ХР сп3) так и на ноуте (Виста)

Хотелось бы как можно скорее получить пофиксеную версию. а то без пакетной обработки как то совсем неинтересно (((

Пересылайте мне на мыло тексты, которые вы синомайзите

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий