Ken

Рейтинг
31
Регистрация
22.04.2003

Тут можно задаться еще одним вопросом: А сможет техника учета онтологии быть лучше (по времени и по релевантности), чем пред обработка parser-ами или chunker-ами?

Думаю, что в лучшем варианте - следует ожидать стандарта по ведению сематических связей.

В отличие от русского языка, у них задачи морфологии и синтаксиса формализованы давно, готовых решений много, поэтому они переходят уже на более высокий уровень, модной нынче онтологии.

Допустим найдется Н-е количество людей - профессионалов в совей области знаний, которые выпишут семантические связи, которые будут статистичекски проработаны. А будет ли достигнуто "понимание" - тут надо у Гуру спрашивать:) Статистика - вообще лженаука:)

Спасибо за ответ:)

Наверное, этого достаточно для ПМ старого поколения.

Дальнейшее... за эвристиками сопоставления запросов пользователя с образами документов.

Будут ли они понимать язык используя несколько унарных и бинарных операций и быстрый-быстрый перебор?

Сможет ли определенно большой набор онтологических, семантических связей привести к проблескам в ИИ? Время покажет...

Как писал zurzmancer

нахождение оптимального сценария работы с системой поиска (включая удобство вывода и последующей работы с найденной информацией)

В результате возникает вопрос: возможен ли такой сценарий (набор сценариев), который бы "точно" передавал смысл искомого документа, обеспечивающий максимальные релевантность и полноту поиска?

Да конечно! (Я следую теме система старого поколения)

В первую очередь, интересены задачи которые ставятся после этих 2-х шагов. Как я понимаю - дальнейшие разработки идут в области ранжирования результатов (ссылок на документы в простейшем случае). Не так ли?

Когда система четко находит слова - это прошлый век.

С какими задачами сталкиваются разработчики на следующем шаге?

Ну что же - затраты действитлельно велики. Но ведь можно и ограничиться.

Допустим - это будет локальный поисковик в текстовых документах.

2 - шага пройдены. Подключен некий морфологический словарь и стэммер. Создана система индексации слов, для словоформы можно найти список документов где-она встречается. Что следует делать дальше?

...

2icecreator

Бывают моменты, что пользователь сам не знает точно или не может сформулировать - ЧТО ОН ИЩЕТ.

Присоединяюс к вопросу "что такое осмысленность" в ващем понимании? Можно ли поподробнее?

Спасибо

В первую очередь интересны тесты для русскоязычных текстов.

Конечно, я видел этот интересный семинар, он к сожалению платный, с другой стороны он, видимо, будет напоминать соревнования "черепахи со страусом".

Надеюсь, что результатом таких семинаров будет появление программы стандартных тестов любой псевдопоисковой машины на хорошем корпусе текстов с разнообразнейшими запросами и оценками.

1 234 5
Всего: 49