Тезаурус, как решение для семантики.

P
На сайте с 07.01.2004
Offline
3
2246

Здравствуйте!

Интересуюсь темой тезаурусов. Что это такое. Если в них существую связи, то нельзя ли тезаурусами решать задачи семантики (хотя бы для автоматического определения аспектов понятий)?

Вообще, плохо представляю, как сроятся эти тезаурусы, и в каком виде представляются.

Размышляя на эту тему придумал простейший алгоритм построения такой цепочки связей:

1. Имеем толковый словарь русского языка.

2. В толковании каждое слово ссылается на его же толкование.

3. Выходит, что все толкования имеют зацикленные ссылки в своем дереве значений слов.

Тут вопрос №1, как разрешить бесконечные блуждания? (Можно просто волевым решение, т.е. числом связей, но это очень грубо). Так же интересен вариант зацикливания. (Но можно включить механизм проверки повторов).

А вообще, следя за рассуждениями на форуме, вижу, что семантики все боятся, как черт ладана. В чем дело? Какие такие неразрешимые задачи вы видите для программирования? Какие вообще вы бы выдвинули требования к семантическому анализу?

С уважением, Павел.

I
На сайте с 22.09.2003
Offline
36
#1

да уж, а зачем он тебе этот тезаурус? с тезаурусом любой ... сможет, а вот ты без него попробуй поиск человеческий сделай :)

А если честно то этот форум похоже обсуждает только обычные тупые поисковики, которые со смыслом и тезаурусом никак не связаны. Кстати я все бьюсь, делаю осмысленный поиск. Тезаурус - это просто знания о мире, ведь так? Что-то вроде толкового словаря но расширенный. Вообще-то проблема с зацикливанием есть! Если всзять смысл слова "смысл", то в толковом словаре уже на второй итерации получаем зацикливание: "смысл - это типа знание", смотрим "знание это смысл". Вот и ая-улю. Значит вообще говоря человеческий язык не имеет смысла?

С уважением Ермолаев Дмитрий
B
На сайте с 02.09.2002
Offline
42
bvd
#2
Как писал icreator
Если всзять смысл слова "смысл", то в толковом словаре уже на второй итерации получаем зацикливание: "смысл - это типа знание", смотрим "знание это смысл". Вот и ая-улю. Значит вообще говоря человеческий язык не имеет смысла?

Это значит, что разработка лингвистических ресурсов (в том числе

толковых словарей) для описания мира (или отдельных предметных областей) дело не простое.

Если Вас это интересует - поищите по словам ontology, OntoWeb ...

Григорий Селезнев
На сайте с 25.09.2001
Offline
298
#3

посмотрите еще вот тут http://linguist.nm.ru/

B
На сайте с 02.09.2002
Offline
42
bvd
#4
Как писал Professor
посмотрите еще вот тут http://linguist.nm.ru/

а морфология здесь причем?

euhenio
На сайте с 21.09.2001
Offline
357
#5
Тут вопрос №1, как разрешить бесконечные блуждания? (Можно просто волевым решение, т.е. числом связей, но это очень грубо). Так же интересен вариант зацикливания

-можно попробовать pagerank-подобный вариант расчета.

А вообще, слабо верится в возможность построения связей именно таким способом. Ведь не только

каждое слово ссылается на его же толкование

,но некоторым осмысленным образом ссылается, в контексте других слов из определения.

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
P
На сайте с 07.01.2004
Offline
3
#6

Ура! Вот тут мы уже начали говорить о настоящем интеллектуальном поиске! Конечно, циклы - это главная проблема, но есть более-менее простое решение: при встрече цикла эту ветку сразу закрывать, а продолжать строить представление о мире по другим веткам. Именно представление о Мире! Тогда возникнет еще одна серьезная проблема - ОЗУ и скорость работы. Представьте, что будет с обработкой одного слова, если программа начнет ходить по всем веткам из своего толкования. Это может достичь объема равного самой базе слов. Но с другой стороны, база слов для компьютера - это не такой уж значительный объем. Если ему просто задать чтобы он сам построил структуру связей на основе того же простейшего толкового словаря, то уже буде сделан прорыв в области смыслового поиска. Тут конечно работка для математиков в первую голову.

Ashmanov
На сайте с 21.11.2000
Offline
66
#7

значит, вообще говоря человеческий язык не имеет смысла?

Интересно, что в ЕЖЕ-листе была только что такая дискусия недавно. Повторю свои аргументы.

Да, это верно. В языке, а точнее - в тексте - нет никакого смысла.

Какой смысл в тексте надписи на мёртвом языке допотопного народа?

Скорее всего, даже если язык будет расшифрован современными ислледователями, смысла прибавится не очень много. А вот если оживят тамошнюю мумию, смысла сразу прибавится.

Хороший пример даёт В.Файн в своих работах. Вот мужчина говорит женщине "помнишь июль?". Для постороннего наблюдателя смысла почти нет. Для неё - масса.

Таким образом, смысл зависит от наблюдателя. Как в квантовой механике. Нет его - нет и смысла. То есть текст - это только код, запускающий создание смысла в уме наблюдателя. Как, впрочем, и другие знаки.

При записи пишущим многомерной структуры смысла, существующей в его уме, в виде более плоской структуры текста она сжимается, а потом в уме читающего разжимается - с потерями и искажениями. Мысль изреченная есть ложь.

Поэтому любые претензии на создание системы, "извлекающей" смысл - шарлатанство. Кролика в шляпе нет.

С уважением, Игорь Ашманов Все для оптимизации (рассылка, сервисы): www.optimization.ru (www.optimization.ru) Сервис по созданию собственных поисковиков: www.flexum.ru (www.flexum.ru)
A
На сайте с 23.11.2000
Offline
166
#8
Как писал Ashmanov
Поэтому любые претензии на создание системы, "извлекающей" смысл - шарлатанство. Кролика в шляпе нет.

Дополню, любимая ссылка и место из "Суммы технологий" - http://lib.ru/LEM/summa/summgl4o.htm

- - -

О значении з_н_а_ч_е_н_и_я написаны целые библиотеки. Но никто не

знает, чем же оно является в том одном-единственном необходимом

Конструктору смысле, который позволяет не только дать определение

(определений таких - тьма), но и сконструировать систему, ведущую себя

так, как существо, п_о_н_и_м_а_ю_щ_е_е значение.

З_н_а_ч_е_н_и_е - это сущее бедствие структурной лингвистики и

кибернетики, не говоря уж о философах, которые хотя и претерпели от него

множество страданий, но уже ухитрились кое-как к нему привыкнуть. Над

каждым, кто в той или иной мере занимается языком в качестве специалиста,

висит, как дамоклов меч, проблематика, относящаяся к з_н_а_ч_е_н_и_ю.

Где бы ни появилось з_н_а_ч_е_н_и_е, точная и строгая работа

становится невозможной - за ним выползают кошмары бесконечности, зыбкости,

неопределенности, а все квантованные, поэтапные, точные действия тонут в

наплыве проклятого смыслового мрака. Поэтому было придумано неисчислимое

количество способов помешать этому духу проникнуть туда, где прежде всего

нужна строгость. Действовали по-разному...

- - -

и далее. :)

I
На сайте с 22.09.2003
Offline
36
#9
Как писал Ashmanov
При записи пишущим многомерной структуры смысла, существующей в его уме, в виде более плоской структуры текста она сжимается, а потом в уме читающего разжимается - с потерями и искажениями. Мысль изреченная есть ложь.
Поэтому любые претензии на создание системы, "извлекающей" смысл - шарлатанство. Кролика в шляпе нет.

Вообще, Вы, Игорь, очень правильно все заметили. Машина не может извлекать СМЫСЛ, она лишь выдает ту "плоскую структуру текста", а человек уже эту структуру разжимает в своем понимании "с потерями и искажениями". Но не соглашусь тем, что осмысленного машинного поиска быть не может. Я сужу по своей Системе о-поиска. Она находит все же более подходящие смысловые "плоские структуры текста", чем то что реализовано на обычных поисковиках, например даже на Вашем Яндексе, при всем к нему уважении. И кстати, этот обычный поиск ещё все наровят "интеллектуальным" обозвать! Вот поищите в инете "интеллектальный поиск" и Вы найдете кучу криков, что у них он есть, хотя на самом деле там стоит поисковик Яндеса. Так почему бы поиск, который делает моя Система, не назвать "осмысленный поиск" или "поиск по смыслу"?

spark
На сайте с 24.01.2001
Offline
130
#10

icreator, что Вы имели ввиду, говоря Ашманову:

например даже на Вашем Яндексе

как-то нелепо это звучит, согласитесь.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий