- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах
Это на 45% больше, чем в 2022 году
Оксана Мамчуева
Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ
Экспертная оценка Адмитад
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Здравствуйте!
Интересуюсь темой тезаурусов. Что это такое. Если в них существую связи, то нельзя ли тезаурусами решать задачи семантики (хотя бы для автоматического определения аспектов понятий)?
Вообще, плохо представляю, как сроятся эти тезаурусы, и в каком виде представляются.
Размышляя на эту тему придумал простейший алгоритм построения такой цепочки связей:
1. Имеем толковый словарь русского языка.
2. В толковании каждое слово ссылается на его же толкование.
3. Выходит, что все толкования имеют зацикленные ссылки в своем дереве значений слов.
Тут вопрос №1, как разрешить бесконечные блуждания? (Можно просто волевым решение, т.е. числом связей, но это очень грубо). Так же интересен вариант зацикливания. (Но можно включить механизм проверки повторов).
А вообще, следя за рассуждениями на форуме, вижу, что семантики все боятся, как черт ладана. В чем дело? Какие такие неразрешимые задачи вы видите для программирования? Какие вообще вы бы выдвинули требования к семантическому анализу?
С уважением, Павел.
да уж, а зачем он тебе этот тезаурус? с тезаурусом любой ... сможет, а вот ты без него попробуй поиск человеческий сделай :)
А если честно то этот форум похоже обсуждает только обычные тупые поисковики, которые со смыслом и тезаурусом никак не связаны. Кстати я все бьюсь, делаю осмысленный поиск. Тезаурус - это просто знания о мире, ведь так? Что-то вроде толкового словаря но расширенный. Вообще-то проблема с зацикливанием есть! Если всзять смысл слова "смысл", то в толковом словаре уже на второй итерации получаем зацикливание: "смысл - это типа знание", смотрим "знание это смысл". Вот и ая-улю. Значит вообще говоря человеческий язык не имеет смысла?
Если всзять смысл слова "смысл", то в толковом словаре уже на второй итерации получаем зацикливание: "смысл - это типа знание", смотрим "знание это смысл". Вот и ая-улю. Значит вообще говоря человеческий язык не имеет смысла?
Это значит, что разработка лингвистических ресурсов (в том числе
толковых словарей) для описания мира (или отдельных предметных областей) дело не простое.
Если Вас это интересует - поищите по словам ontology, OntoWeb ...
посмотрите еще вот тут http://linguist.nm.ru/
посмотрите еще вот тут http://linguist.nm.ru/
а морфология здесь причем?
-можно попробовать pagerank-подобный вариант расчета.
А вообще, слабо верится в возможность построения связей именно таким способом. Ведь не только
,но некоторым осмысленным образом ссылается, в контексте других слов из определения.
Ура! Вот тут мы уже начали говорить о настоящем интеллектуальном поиске! Конечно, циклы - это главная проблема, но есть более-менее простое решение: при встрече цикла эту ветку сразу закрывать, а продолжать строить представление о мире по другим веткам. Именно представление о Мире! Тогда возникнет еще одна серьезная проблема - ОЗУ и скорость работы. Представьте, что будет с обработкой одного слова, если программа начнет ходить по всем веткам из своего толкования. Это может достичь объема равного самой базе слов. Но с другой стороны, база слов для компьютера - это не такой уж значительный объем. Если ему просто задать чтобы он сам построил структуру связей на основе того же простейшего толкового словаря, то уже буде сделан прорыв в области смыслового поиска. Тут конечно работка для математиков в первую голову.
значит, вообще говоря человеческий язык не имеет смысла?
Интересно, что в ЕЖЕ-листе была только что такая дискусия недавно. Повторю свои аргументы.
Да, это верно. В языке, а точнее - в тексте - нет никакого смысла.
Какой смысл в тексте надписи на мёртвом языке допотопного народа?
Скорее всего, даже если язык будет расшифрован современными ислледователями, смысла прибавится не очень много. А вот если оживят тамошнюю мумию, смысла сразу прибавится.
Хороший пример даёт В.Файн в своих работах. Вот мужчина говорит женщине "помнишь июль?". Для постороннего наблюдателя смысла почти нет. Для неё - масса.
Таким образом, смысл зависит от наблюдателя. Как в квантовой механике. Нет его - нет и смысла. То есть текст - это только код, запускающий создание смысла в уме наблюдателя. Как, впрочем, и другие знаки.
При записи пишущим многомерной структуры смысла, существующей в его уме, в виде более плоской структуры текста она сжимается, а потом в уме читающего разжимается - с потерями и искажениями. Мысль изреченная есть ложь.
Поэтому любые претензии на создание системы, "извлекающей" смысл - шарлатанство. Кролика в шляпе нет.
Поэтому любые претензии на создание системы, "извлекающей" смысл - шарлатанство. Кролика в шляпе нет.
Дополню, любимая ссылка и место из "Суммы технологий" - http://lib.ru/LEM/summa/summgl4o.htm
- - -
О значении з_н_а_ч_е_н_и_я написаны целые библиотеки. Но никто не
знает, чем же оно является в том одном-единственном необходимом
Конструктору смысле, который позволяет не только дать определение
(определений таких - тьма), но и сконструировать систему, ведущую себя
так, как существо, п_о_н_и_м_а_ю_щ_е_е значение.
З_н_а_ч_е_н_и_е - это сущее бедствие структурной лингвистики и
кибернетики, не говоря уж о философах, которые хотя и претерпели от него
множество страданий, но уже ухитрились кое-как к нему привыкнуть. Над
каждым, кто в той или иной мере занимается языком в качестве специалиста,
висит, как дамоклов меч, проблематика, относящаяся к з_н_а_ч_е_н_и_ю.
Где бы ни появилось з_н_а_ч_е_н_и_е, точная и строгая работа
становится невозможной - за ним выползают кошмары бесконечности, зыбкости,
неопределенности, а все квантованные, поэтапные, точные действия тонут в
наплыве проклятого смыслового мрака. Поэтому было придумано неисчислимое
количество способов помешать этому духу проникнуть туда, где прежде всего
нужна строгость. Действовали по-разному...
- - -
и далее. :)
При записи пишущим многомерной структуры смысла, существующей в его уме, в виде более плоской структуры текста она сжимается, а потом в уме читающего разжимается - с потерями и искажениями. Мысль изреченная есть ложь.
Поэтому любые претензии на создание системы, "извлекающей" смысл - шарлатанство. Кролика в шляпе нет.
Вообще, Вы, Игорь, очень правильно все заметили. Машина не может извлекать СМЫСЛ, она лишь выдает ту "плоскую структуру текста", а человек уже эту структуру разжимает в своем понимании "с потерями и искажениями". Но не соглашусь тем, что осмысленного машинного поиска быть не может. Я сужу по своей Системе о-поиска. Она находит все же более подходящие смысловые "плоские структуры текста", чем то что реализовано на обычных поисковиках, например даже на Вашем Яндексе, при всем к нему уважении. И кстати, этот обычный поиск ещё все наровят "интеллектуальным" обозвать! Вот поищите в инете "интеллектальный поиск" и Вы найдете кучу криков, что у них он есть, хотя на самом деле там стоит поисковик Яндеса. Так почему бы поиск, который делает моя Система, не назвать "осмысленный поиск" или "поиск по смыслу"?
icreator, что Вы имели ввиду, говоря Ашманову:
как-то нелепо это звучит, согласитесь.