Q: морфологический разбор - открытый код?

!Иван FXS
На сайте с 16.11.2001
Offline
119
1999

1. Правильно ли я понимаю, что сейчас все (более-менее дееспособные) системы морфологического разбора (для русского языка) являются "закрытыми", - в том смысле, что их авторы (хозяева) хотят - так или иначе - получать за них денежки, а не отдавать их ... как говорила Сова - "бесплатно, то есть даром"?

2. По моим дилетантским представлениям, граница между "закрытыми" и "открытыми" программистскими задачами все время постепенно смещается: задачи (точнее, алгоритмы их решения), которые раньше считались очень ценным ноу-хау, - постепенно переходят в разряд "банальных", скопидомничать на которых считается ... странным.

Вопрос: существует ли перспектива - хоть сколько-нибудь обозримая - перехода subj-а (алгоритмов морфологического разбора для русского языка) в разряд "открытых задач"?

Григорий Селезнев
На сайте с 25.09.2001
Offline
298
#1
[Удален]
#2

В своих разработках я использую бесплатный вариант морфологического модуля http://risearch.org, есть и платный, за 50$, который видимо я куплю. В свою очередь хочу добавить, что наличие бесплатных, нормально работающих модулей положительно сказывается на развитии отрасли интернет программирования в целом. В ближайшее время собираюсь сам выложить в открытый доступ глобальную статистику встречаемости слов в интернете и таблицу для определения тематической направленности текстов.

!Иван FXS
На сайте с 16.11.2001
Offline
119
#3
Как писал Professor
http://linguist.nm.ru/

- эээ ... сорри ... Вы - о:

Лицензия для некоммерческого использования может быть предоставлена бесплатно после подписания соответствующего договора о некоммерческом использовании, в котором явно выражается согласие на полный отказ от прямого или косвенного извлечения прибыли от эксплуатации Модуля или продуктов, использующих Модуль.
?

(на странице с многозначительным адресом http://linguist.nm.ru/ling/price.html ) ;-)

- интересно, если я захочу использовать этот модуль в

а. своей собственной

б. (профессиональной) РАБОТЕ

... а работаю я, естественно, в КОММЕРЧЕСКОЙ организации (не в фонде благотворительном же!), то это - куда?

VT
На сайте с 27.01.2001
Offline
130
#4

!Иван FXS, а может Вы полностью изложите всю задачу, которую хотите решить, а мы подумаем, чем сможем помочь?

Многие из технологий, о которых вы спрашивали на этом форуме, в том или ином виде, но есть.

!Иван FXS
На сайте с 16.11.2001
Offline
119
#5

задачУ (да еще - в единственном числе!) - это хороший вопрос.

Вообще-то я не программист (в смыле - професиональный), мне - по нынешней работе (что-то типа аналитика экономического, бизнесового, иногда - инновационого) просто нужно много шариться по интернету.

А всякими "интеллектуальными технологиями" я интересуюсь факультативно, в порядке личного развития. Гордо ношу, так сказать, звание Advanced User.

Одна из моих задумок - сделать ИНДИВИДУАЛЬНЫЙ ИНСТРУМЕНТАРИЙ для работы с интернетом - в виде MS Access и IE под ним (то есть - SHDocVw.InternetExplorer) ... Ну и - в морфологический разбор я очень быстро в этой задачке упираюсь.

VT
На сайте с 27.01.2001
Offline
130
#6
А всякими "интеллектуальными технологиями" я интересуюсь факультативно, в порядке личного развития. Гордо ношу, так сказать, звание Advaced User.

Одна из основных проблем, господин Advanced User, в том, что Вы говорите на языке, совершенно непонятном разработчикам. Попробуйте выражаться по-человечески. :)

Одна из моих задумок - сделать ИНДИВИДУАЛЬНЫЙ ИНСТРУМЕНТАРИЙ для работы с интернетом - в виде MS Access и IE под ним (то есть - SHDocVw.InternetExplorer) ... Ну и - в морфологический разбор я очень быстро в этой задачке упираюсь.

Морфологический разбор в основном ничего не определяет. Существительные имеют свойство наиболее часто употребляться в нормальной форме.

Попробуйте логично, четко и кратко изложить, для чего нужен "ИНДИВИДУАЛЬНЫЙ ИНСТРУМЕНТАРИЙ " и почему он должен работать под MS Access и IE. Mobilis in Mobile.

!Иван FXS
На сайте с 16.11.2001
Offline
119
#7

Advanced, конечно ... это была опечатка.

ИНДИВИДУАЛЬНЫЙ ИНСТРУМЕНТАРИЙ нужен для РАБОТЫ с контентом (по-русски - содержимым) интернета - при отношении к последнему как к огромной БАЗЕ ЗНАНИЙ.

_______________

PS. "Нормальная форма" - это именительный падеж единственого числа, я правильно понимаю? И какая же доля (%) "употреблений существительных" приходится на нормальную форму?

Не говоря уже о том, что СЛОВОИЗМЕНЕНИЕ создает не только затруднения для несчастных "индексаторов", но еще и служит для ВЫРАЖЕНИЯ СМЫСЛА (в частности, - создает СВЯЗАННОСТЬ текста).

VT
На сайте с 27.01.2001
Offline
130
#8
для РАБОТЫ с контентом

Что с ним нужно делать?

огромной БАЗЕ ЗНАНИЙ

Что, по-вашему, БАЗА ЗНАНИЙ, и как интернет может ею быть?

PS. "Нормальная форма" - это именительный падеж единственого числа, я правильно понимаю? И какая же доля (%) "употреблений существительных" приходится на нормальную форму?

Ответ на этот вопрос вам вряд ли скажет даже Яндекс. Но процент высокий.

Не говоря уже о том, что СЛОВОИЗМЕНЕНИЕ создает не только затруднения для несчастных "индексаторов", но еще и служит для ВЫРАЖЕНИЯ СМЫСЛА (в частности, - создает СВЯЗАННОСТЬ текста).

Что такое СМЫСЛ и каким образом СЛОВОИЗМЕНЕНИЕ может его передавать?

!Иван FXS
На сайте с 16.11.2001
Offline
119
#9

> Что с ним нужно делать?

Вы спрашиваете вообще или про меня лично?

Разные люди "работают с контентом" по разному ... но в целом это можно описать как:

а. извлечение "сведений", "знаний", "информации" необходимых для конкретной деятельности конкретного человека

б. в значительно меньшей мере, но тем не менее нужно указать - помещение в интернет какой-то собственной информации.

>Что, по-вашему, БАЗА ЗНАНИЙ, и как интернет может ею быть?

- это сложный вопрос, и в двух словах я не могу на него ответить. Но я имею некоторое представление о том, что принято ... у специалистов и advanced users ... называть "базами знаний", и ... что-то подобное и имел в виду, когда употреблял этот термин.

(Вы понимаете, что Вы как бы загнали меня в ситуацию "разгвора по понятиям", и поскольку я выбрал - принять этот вызов, а не стушеваться, - то я вынужден выдавать достаточно общие, философские формулировки!)

> Ответ на этот вопрос вам вряд ли скажет даже Яндекс. Но процент высокий.

- меня интересовало не точное значение, а Ваша оценка, чтобы понять, о чем собственно, был Ваш тезис. Кстати:Ученые подсчитали, какие падежи наиболее часто употребляются в текстах. На именительный падеж приходится 33 процента всех падежных форм, на родительный падеж – 24 процента, на винительный – 20 процентов, на остальные падежи (дательный, творительный, предложный – 23 процента). А вот в разговорной речи на именительный падеж приходится 50 процентов, на винительный – 20 процентов, на родительный – 15 процентов.

>Что такое СМЫСЛ и каким образом СЛОВОИЗМЕНЕНИЕ может его передавать?

Вы понимаете разницу между "хлебе" и "хлебом"?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий