http://itman.narod.ru/faq/ffaq.html
Тут можно задаться еще одним вопросом: А сможет техника учета онтологии быть лучше (по времени и по релевантности), чем пред обработка parser-ами или chunker-ами?
Думаю, что в лучшем варианте - следует ожидать стандарта по ведению сематических связей.
В отличие от русского языка, у них задачи морфологии и синтаксиса формализованы давно, готовых решений много, поэтому они переходят уже на более высокий уровень, модной нынче онтологии.
Допустим найдется Н-е количество людей - профессионалов в совей области знаний, которые выпишут семантические связи, которые будут статистичекски проработаны. А будет ли достигнуто "понимание" - тут надо у Гуру спрашивать:) Статистика - вообще лженаука:)
Спасибо за ответ:)
Наверное, этого достаточно для ПМ старого поколения.
Дальнейшее... за эвристиками сопоставления запросов пользователя с образами документов.
Будут ли они понимать язык используя несколько унарных и бинарных операций и быстрый-быстрый перебор?
Сможет ли определенно большой набор онтологических, семантических связей привести к проблескам в ИИ? Время покажет...
В результате возникает вопрос: возможен ли такой сценарий (набор сценариев), который бы "точно" передавал смысл искомого документа, обеспечивающий максимальные релевантность и полноту поиска?
Да конечно! (Я следую теме система старого поколения)
В первую очередь, интересены задачи которые ставятся после этих 2-х шагов. Как я понимаю - дальнейшие разработки идут в области ранжирования результатов (ссылок на документы в простейшем случае). Не так ли?
Когда система четко находит слова - это прошлый век.
С какими задачами сталкиваются разработчики на следующем шаге?
Ну что же - затраты действитлельно велики. Но ведь можно и ограничиться.
Допустим - это будет локальный поисковик в текстовых документах.
2 - шага пройдены. Подключен некий морфологический словарь и стэммер. Создана система индексации слов, для словоформы можно найти список документов где-она встречается. Что следует делать дальше?
...
2icecreator
Бывают моменты, что пользователь сам не знает точно или не может сформулировать - ЧТО ОН ИЩЕТ.
Присоединяюс к вопросу "что такое осмысленность" в ващем понимании? Можно ли поподробнее?
Спасибо
В первую очередь интересны тесты для русскоязычных текстов.
Конечно, я видел этот интересный семинар, он к сожалению платный, с другой стороны он, видимо, будет напоминать соревнования "черепахи со страусом".
Надеюсь, что результатом таких семинаров будет появление программы стандартных тестов любой псевдопоисковой машины на хорошем корпусе текстов с разнообразнейшими запросами и оценками.