Hkey Auto Synomazer вышел!

Hkey
На сайте с 30.09.2006
Offline
222
#101

Версия 0.3

1. Добавлен движок для снятия омонимии.

Что такое омонимия?

Например, если у нас есть слово "города", то оно может быть и в единственном числе родительного падежа ("на окраине города"), и во множественном числе именительного ("героями стали следующие города:").

Зачем это нужно?

Если синоним имеет другую морфологическую группу, то омонимия преобразуется в строковую неоднозначность. Например, если замена +город%+населенный +пункт. То в первом случае должно получиться "на окраине населенного пункта", а во втором "героями стали следующие населенные пункты". HASyn в этих случаях не производил замену (чтобы сохранить качество текста), теперь он будет стараться снять омонимию (в большинстве случаев он ее снимает) и при успехе сделает замену в правильном падеже. Это увеличит процент замен на 10-15% для однословных замен и на более чем 25% для 1 в 2, 2 в 1, 2 в 2 и прочих. Это также касается и импортированных баз. Другими словами на одних и тех же базах программа делает еще больший процент замен, чем другие синомайзеры. В дальнейшем такая возможность будет добавлена и к ручным синонимам. Раньше HASyn их склонял в наиболее вероятную словоформу выводя один красный восклицательный знак перед синонимом в списке).

2. Добавлены линейно исполняемые замены - словарные замены у которых вместо первого слова заглушка W1.

3. Добавлен интерфейс теста WScript. Чтобы его запустить нужно перейти в расширенный режим и нажать на последнее действие.

4. В хелп добавлена информация по WScript.

5. Увеличена база автоисправления орфографических ошибок более чем вдвое.

5. Раза в полтора увеличилась база полной версии программы и немного возросла демо-база.

P.S. Если после прочтения новой статьи в помощи у вас остались вопросы по WScript, то я на них отвечу. Хочу собрать небольшой FAQ.

Демо-версия.

http://altalabs.ru/HASyn.rar

Полная версия по тому-же адрессу, с которого вы закачивали.

HTraffic.ru (http://HTraffic.ru/) - удобная система для управления контекстной рекламой. тема на форуме (/ru/forum/810827) HTracer (http://htracer.ru/) - скрипт для автопродвижения сайтов по НЧ и СЧ запросам. Для больших сайтов от 100 страниц. (тема на форуме (/ru/forum/676867))
vtomas
На сайте с 19.03.2007
Offline
102
#102
Hkey:
P.S. Если после прочтения новой статьи в помощи у вас остались вопросы по WScript, то я на них отвечу. Хочу собрать небольшой FAQ.

Сказавши "А", говорите и "Б". Это я о WScript как им пользоваться не понял.

Хорошее стоит дорого, на плохое не стоит и тратиться. В поисках VPS захостился здесь (http://ipserver.su), а бэкапы храню здесь (http://billing.markovservers.com/backup/pl.php?65).
Hkey
На сайте с 30.09.2006
Offline
222
#103
vtomas:
Сказавши "А", говорите и "Б". Это я о WScript как им пользоваться не понял.

В помощи есть. Ну в двух словах.

+предпочитать W2::<часть_речи==сущ, число==мн,падеж==рд> W3::<часть_речи==сущ, число==мн,падеж==дт>%больше +любить W3::<падеж=рд> чем W2::<>

превратит

"предпочитать брюнеток блондинкам" в "больше любить блондинок чем брюнеток"

"предпочитал лекарства травам" в "больше любил травы чем лекарства"

vtomas
На сайте с 19.03.2007
Offline
102
#104

Вот я тупой, что делать не пойму, сделайте хелп для не столь далеких, ну и другие поля как заполнять?

gif 19.06.gif
Hkey
На сайте с 30.09.2006
Offline
222
#105
vtomas:
Вот я тупой, что делать не пойму, сделайте хелп для не столь далеких, ну и другие поля как заполнять?

На скрине в колонке добавления. слева параметр, справа константа, посередине оператор. Затем идет кнопка вставить вставляющая этот текст вверх. Это мастер который ведет параметры и константы движка нужен для удобства.

вид - это вид глагола есть совершенный вид (сделать), есть несовершенный вид (делать).

vtomas
На сайте с 19.03.2007
Offline
102
#106

И снова ни чего не понял. :)

Сделайте по пунктам:

1. здесь вводим слово (словосочетание);

2. здесь выбираем род (число или что еще)

3. жмем кнопку ...

4. получаем результат

Сделайте хоть скрин с цифрами и пояснениями к ним

Hkey
На сайте с 30.09.2006
Offline
222
#107
vtomas:
И снова ни чего не понял. :)
Сделайте по пунктам:
1. здесь вводим слово (словосочетание);
2. здесь выбираем род (число или что еще)
3. жмем кнопку ...
4. получаем результат
Сделайте хоть скрин с цифрами и пояснениями к ним
+предпочитать W2::<часть_речи==сущ, число==мн,падеж==рд> W3::<часть_речи==сущ, число==мн,падеж==дт>%больше +любить W3::<падеж=рд> чем W2::<>
+предпочитать

ищем слово предпочитать в любой словоформе (предпочитать,предпочитал и других). Плюсик указывает, что мы его словоформу запомним и потом используем.

W2::<часть_речи==сущ, число==мн,падеж==рд>

произвольное слово с наложенными условиями (существительное, множественное число, родительный падеж). Порядок условий не важен. "часть_речи==сущ, число==мн,падеж==рд" тоже самое что и "падеж==рд, число==мн, часть_речи==сущ"

W3::<часть_речи==сущ, число==мн,падеж==дт>

произвольное слово с наложенными условиями (существительное, множественное число, дательный падеж)

больше +любить

выводим слово "больше". Выводим слово любить в той же словоформе, что и предпочитать. Можно было вместо плюсиков использовать любить::<согл_рпч=w1> согласовать по роду числу и падежу с первым словом. (Хотя лучше использовать плюсики). ссылки w1,w2 ... w9 и заглушки в правой части W1,W2 ... W9 говорят не о индексе заглушек в левой части, а о номере слова в исходном тексте. Как вы видите W1 не встречается в замене, но это не значит, что нельзя использовать w1.

W3::<падеж=рд>

выводим третье слово, преобразуя его падеж в родительный

W2::<>

выводим второе слово без изменений

aprok
На сайте с 27.11.2008
Offline
45
#108

наверно пива перепил , но заумно как-то это все выглядит =)

Hkey
На сайте с 30.09.2006
Offline
222
#109
aprok:
наверно пива перепил , но заумно как-то это все выглядит =)

WScript это расширение синтаксиса. Я могу дать ссылку, где расписывается одна детерминанта (одно правило) для снятия омонимии на 7 страниц. В WScript такая детерминанта занимает одну строку.

Вы можете как и обычно писать:

красивый%прекрасный

или так

красивый +женщина%+красавица

WScript позволяет накладывать дополнительные ограничения.

+результаты::<число==мн>%+данные

Либо использовать если синоним глагола управляет другим падежом.

Например в словарях синонимов для человека, есть падежные вопросы (например, кого, что). И эти падежные вопросы не совпадают у синонимов. Счас я немного занят. Чуть позже напишу пример.

Hkey добавил 20.06.2009 в 01:33

Вот пример. В русском есть много полумодальных глаголов. Например, "планировать". Планировал отдохнуть - это модальная форма синоним: "собирался". Планировал отдых - не модальная форма. Прошлый синоним не применим (собирался отдых - полный бред).

В других синомайзерах нужно писать что-то вроде


"планировать отдохнуть"%собираться отдохнуть
"планировала отдохнуть"%собиралась отдохнуть
...
"планировать найти"%собираться найти
"планировала найти"%собиралась найти
...
Итак далее для наиболее популярных глаголов.

В WSript это делается так.


+планировать W2::<часть_речи==инфинитив>%+собираться W2::<>

Для справки. Инфинитив - это базовая форма глаголов. Например, найти, вернуться, мочь, кинуть.... Именно в инфинитиве слова стоят после модальных глаголов.

Этот пример заменит планировать + СЛОВО_В_ИНФИНИТИВЕ на собираться + СЛОВО_В_ИНФИНИТИВЕ. Это заменит "планировал сделать" на "собирался сделать". Но не будет заменять "планировал дело" на "собирался дело".

vtomas
На сайте с 19.03.2007
Offline
102
#110

На сколько я понял для WScript сделана некая оболочка (на скрине выше), а то что изложено вами это принцип ее работы, мне нет глубокого смысла вникать в "детерминанты" и прочее (оставьте их для разработчиков-программистов морфологии). Сделайте сухой остаток, покажите пример работы WScript (скрин или видео) в ключе для "лузеров" - здесь пишем слово, здесь жмем кнопку, здесь получаем результат.

P.S. Похоже битву синонимайзеров вы проиграете, победа будет за "БАЗАМИ", морфология падет перед словарем во всех склонениях и падежах. :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий