Соревнование синомайзеров

F
На сайте с 22.07.2009
Offline
3
#31

>>Исходный (fedora - не сочтите за кражу)

это текст с какого-то сайта ... он не мой =))

О, мой блох! ichfedora.blogspot.com
KupluSsilki
На сайте с 13.07.2005
Offline
106
#32
Hkey:
Синомайзинг должен производиться по стандартным базам приложения

поскольку любой синонимайзер - это фактически база синонимов к нему, а не сама программа (программу-то легко написать), правильнее было бы не использовать стандартные базы, а устроить именно соревнование баз - имхо..

бриллиантовые руки (http://www.forweb.ru/бриллиантовые_руки) не наш удел, у нас - деревянные )
Hkey
На сайте с 30.09.2006
Offline
222
#33
KupluSsilki:
поскольку любой синонимайзер - это фактически база синонимов к нему, а не сама программа (программу-то легко написать), правильнее было бы не использовать стандартные базы, а устроить именно соревнование баз - имхо..

Я уже отвечал по этому вопросу. Количество замен для разных приложений при одинаковой базе варьируется на уровне 10%-20% процентов. Однако качество текста может варьироваться очень значительно. Более того у разных прог разные возможности по синтаксису базы синонимов.

Например, мой синомайзер поддерживает морфологию, абстрактные условия, дополнительный синтаксис генерационный синтаксис и преобразования словоформы, и язык регулярных выражений, позволяющий найти какую угодно группу слов изменить ее как угодно.

По качеству текста все решает система исключений и противовесов и защита от переходов разнообразных форм омонимии в строковую неоднозначность. Например, в моем синомайзере около 40 параметров определяют, выберется ли одна замена или другая или замены не произойдет.

HTraffic.ru (http://HTraffic.ru/) - удобная система для управления контекстной рекламой. тема на форуме (/ru/forum/810827) HTracer (http://htracer.ru/) - скрипт для автопродвижения сайтов по НЧ и СЧ запросам. Для больших сайтов от 100 страниц. (тема на форуме (/ru/forum/676867))
O
На сайте с 17.09.2009
Offline
37
#34

Любой синонимайзер в автоматическом режиме выдаст "абракадабру", в лучшем случае будет плохо читаем для человека, руками надо править по любому, и от базы все зависит конечно.

Было:

От себя добавлю, что задолго до появления этой статьи я уже пользовался модулем BabelFish, и выяснил одну неприятную особенность. Дело в том, что он иногда возвращает исходное сообщение вместо перевода. Ну, по крайней мере, когда пытаешься переводить с русского на английский. Это еще можно было бы терпеть, если бы труба использовалась только для чтения, но я ведь выход направлял в "БлогоФерму", и если бы в робоблоге появились сообщения на русском, было бы крайне неприятно. К счастью, про этот косяк я узнал еще на стадии настройки трубы. Возможности повлияеть на BabelFish у нас, естественно, нету, так что остается одно решение: после BabelFish поставить еще модуль Filter, и с помощью регулярных выражений отфильтровывать сообщения, которые рыбка перевести не смогла.

После автоматической обработки:

От себя прибавлю, чисто задолго до выходы в свет данной заметки я теснее употреблял модулем BabelFish, и еще установил 1 обидную черта. Дельце в книга, то что он часом отдает отправное информация взамен перевода. Дает, по крайней границе, иногда хочешь тратить со советского на лондонский. Данное снова вполне можно находилось б мириться, ежели б труба употреблялась всего-навсего ради чтения, а я как бы то ни было исход подталкивал в "БлогоФерму", так что ежели б в робоблоге взяли речи на российском, находилось б удивлен обидно. К фортуне, на тему тот, что стая я угадал снова на этапа опции трубы. Перспективе повлияеть на BabelFish у нас, вне всякого сомнения, нет, примерно то что остается единое намерение: уже после BabelFish назначить гораздо модуль Filter, а также со поддержкой систематических речений отфильтровывать оповещения, какие-нибудь рыбка перебросить не сумела.

Отличие от исходного текста 68%

После ручной, (всего то заняла ручная обработка около 2 минут):

От себя прибавлю, то что задолго до выхода в свет данной заметки я уже пользовался модулем BabelFish, и установил одну малоприятную черту. Дело в том, что он время от времени возвращает исходное оповещение взамен перевода. Ну, по крайней мере, как только хочешь переводить с русского на английский. Такое еще вполне можно было бы сносить, ежели бы труба применялась лишь для чтения, однако я все же выход направлял в "БлогоФерму", и в случае если бы в робоблоге показались уведомления на русском, было бы очень досадно. К счастью, про данный косяк я разузнал еще на стадии настройки трубы. Возможности повлияеть на BabelFish у нас, конечно, нет, так что остается единое заключение: опосля BabelFish установить также модуль Filter, и с подмогой регулярных выражений отфильтровывать сообщения, что рыбка перевести не сумела.

Отличие от исходного текста 32%

Это мой Синонимайзер 3.3 под Windows

M1pluss (http://sinonimayzer.ru/) - это парсер, синонимайзер, анализатор и оптимизатор теста, а также генератор сайтов в одном комплекте, за небольшие деньги.
Hkey
На сайте с 30.09.2006
Offline
222
#35

Обработал... На последнем публике, только с демобазой (без базы полной версии). Любой желающий может проверить, скачав дему синомайзера.

Как ни странно отличие от исходного текста такае-же как и вас и равна 68% (длина шингла 5, самый жесткач)

Настройка - самое худшее качество. Без ручных правок.

Явных глюков 3:

английский -> британский

"очень не очень"

решение -> ответ

На настройках флага "- -А" (среднячок)

в тексте только одна ошибка "очень не очень"

при 50 % сходстве (длина шингла 5, самый жесткач)

---------------------

В тексте Offlajn

от себя прибавлю (Серьезная стилистическая ошибка, более того "прибавлю" и "добавлю" это один глагол с разными приставками)

до выходы (Синомайзер мало того, что ваш не решает омонемию, так у него еще нету защиты от перехода омонемии в строковую неоднозначность)

теснее употреблял модулем

обидную черта

Дельце в книга (Дело->Дельце - стилистическая ошибка, в 90% случаев)

отправное информация Умеет ли ваш синомайзер склонять

по крайней границе базы фразеологизмов у вас нет, сомневаюсь об механизме исключений

тратить со советского на лондонский

снова вполне

находилось б мириться

ежели б труба ежели-архаизм

ак бы то ни было

взяли речи на российском

находилось б удивлен обидно

на тему тот, что стая я угадал

снова на этапа опции трубы.

назначить гораздо модуль

систематических речений

....

И так далее....

---------------------------

P.S. Выделяйте жирным. Замены.

SJ
На сайте с 16.03.2008
Offline
78
#36
Hkey:
Обработал... На последнем публике, только с демобазой (без базы полной версии). Любой желающий может проверить, скачав дему синомайзера.

Как ни странно отличие от исходного текста такае-же как и вас и равна 68% (длина шингла 5, самый жесткач)
Настройка - самое худшее качество. Без ручных правок.

🍻

Отличный результат, имхо.

Для тех, кто уверен, что "синонимайзеры все одинаковые, только база важна" - вот вам явное превосходство ЛОГИКИ программы, а не просто размера базы синонимов.

Любимый хостинг (http://beget.ru?id=2902) How can we grow old when the soundtrack of our lives is rock-n-roll?
maxivanov
На сайте с 25.07.2006
Offline
58
#37

я за соревнование синонимайзеров - я думаю лучший разработчик намного увеличит продажи!

слежу за темой...

Главное не в том что ты делаешь, а в том как ты это делаешь!
O
На сайте с 17.09.2009
Offline
37
#38

Отвечу скриншотами

Это с базой что в демке:

С базой стандартной (в комплекте)

С платной базой

Это Ваша программа

Я вижу она ориентирована исключительно на автоматическую работу, но моя программа на ручную, хотя автомат тоже есть.

Hkey
На сайте с 30.09.2006
Offline
222
#39

На скрине моей программы. Вы находитесь на втором этапе (сравнения двух текстов), ручная работа по уникализации происходит на третьем этапе. На этом этапе отмена замен происходит в один клик. Переход на следующий этап - тоже один клик.

У вас, чтобы отменить одну замену, нужно кликнуть мышью по кнопке справа Селекта (в нее нужно еще попасть), потом прочитать, что написано в выпадающем меню, потом навести мышь на выпадающий элемент, потом кликнуть. У меня нужно выбрать руку и щелкнуть по неудачным заменам либо выделить диапазон текста и все замены там прибьются.

Текст напичканный селектами, крайне неудобно читать, чтобы посмотреть какой текст был до этого, нужно совершать дополнительные действия. У меня, нужно просто чуть посмотреть влево.

У меня ручное добавление синонимов происходит на следующем этапе. В правом меню.

P.S. поиграйтесь с со стилем границ Select, что бы он не мешал читать текст. Он не должен быть так заметен.

O
На сайте с 17.09.2009
Offline
37
#40
Hkey:
У вас, чтобы отменить одну замену, нужно кликнуть мышью по кнопке справа Селекта (в нее нужно еще попасть), потом прочитать, что написано в выпадающем меню, потом навести мышь на выпадающий элемент, потом кликнуть.

У вас надо кликнуть мышью по руке (в нее нужно еще попасть), у меня не обязательно по кнопке, можно по слову.

У вас надо щелкнуть по неудачным заменам (в нее тоже нужно еще попасть),

Текст напичканный селектами, крайне неудобно читать, чтобы посмотреть какой текст был до этого, нужно совершать дополнительные действия.

Тут достаточно поставить галочку "ручная обработка" и читается прекрасно.

У меня, нужно просто чуть посмотреть влево.

или чуть посмотреть вверх

У меня ручное добавление синонимов происходит на следующем этапе. В правом меню.

У меня в одном.

P.S. поиграйтесь с со стилем границ Select, что бы он не мешал читать текст. Он не должен быть так заметен.

p.s. решите проблему с richedit, кодировка :)

p.p.s. еще увидев цену я немного опешил 75 у.е. не дороговато?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий