медленный осмысленный поиск

123
F
На сайте с 15.11.2000
Offline
116
#11
Как писал Dmitry Ermolaev
Вот Система научилась простые правила использовать.

А чем это отличается от Пролога или других декларативных языков программирования? Они умеют делать такое уже не один десяток лет.

С уважением,

Александр Садовский.

DE
На сайте с 05.04.2002
Offline
5
#12
А чем это отличается от Пролога или других декларативных языков

Отличие в том что язык общения с ПК естественный. Мой пример правда не на естественном языке, но это вскоре будет исправлено. Вернее правила в Систему вводятся пока на упрощенном, а запрос пользователь уже может делать на естественном языке (или на упрощенном как в примере).

на ПроЛоге это быглядело бы так:

----------------

это(тигр,хищник).

это(хищник,охотится(животное,на(животное))).

это(кабан,животное).

----------

предикат:

----------

охотиться(тигр(уссурийский),на(кабан)).

---------------------

Даже на ПроЛоге так не сделать - он не поймет предиката второго уровня, которых здесь несколько.

И попробуйте пользователя заставить написать запрос в виде предиката ПроЛога:

"охотиться(тигр(уссурийский),на(кабан))."

Ashmanov
На сайте с 21.11.2000
Offline
66
#13

Господа, релевантность лучше всего переводится на русский язык как "соответствие". Вот и всё.

Соответствующий запросу документ и так далее. Русский язык позволяет выразить всё, что угодно, удобным словом.

Если хочется употреблять отдельно от существительного "документ", можно говорить "качество поиска".

Ещё один термин, вполне подходящий для кухонных дискуссий - просто "точность". Его вполне достаточно. Точный поиск, точная машина, точные результаты поиска. Звучит нормально.

В общем смысле релевантность поиска Интернет-машины - это не что иное, как точность.

Полнота же - это качество выборки по возможности ВСЕХ соответствующих документов. Повышать полноту - дело неблагодарное, Дмитрий. Никто не оценит. Слишком их там много сидит, соответствующих, и полноте никто не рад.

Дмитрий, вам может быть интересно прочесть мою статью 1998 года "Национальные особенности поисковых систем", где даётся пояснение понятий точности и полноты:

http://www.osp.ru/school/2000/01/012.htm

Есть и ещё одна статья о том же, только ей невежественный редактор приклеил самовольно собственное и притом неграмотное название:

http://astu.secna.ru/russian/search/tips.htm

(но тут вообще интересно то, что это дикая копия - кто там такие и почему публикуют, я не знаю).

С уважением, Игорь Ашманов Все для оптимизации (рассылка, сервисы): www.optimization.ru (www.optimization.ru) Сервис по созданию собственных поисковиков: www.flexum.ru (www.flexum.ru)
DE
На сайте с 05.04.2002
Offline
5
#14

вообще странно у нас всё

У буржуев Oracle встраивает в свою базу работу с полнотекстовыми документами (interMedia), Микрософт ведет разработки в ИИ и осмыслении текста, всюду XML - продвигают как панацеею для структуризации (читай осмысления) текста. Короче миллиардные инвестиции. А у нас тишина.

Инвестор уверен что русский язык не возможно формализовать. Мол уже лет 20 народ бьется - нифига не получается. Не будем инвестировать.

А как же мы тогда друг друга понимаем? от бога что ли? или телепатией?

Ashmanov
На сайте с 21.11.2000
Offline
66
#15

У нас полным-полно фирм, которые занимаются обработкой естественного языка. В том числе и моя компания - в частности, мы сейчас заканчиваем фильтр спама для Лаборатории Касперского. А также делаем Виртуального собеседника и пр.

Одних русских поисковиков - десяток. Вон Дима Крюков на свои кровные запустил Туртель. Значит, верит в будущее отечественной прикладной лингвистики!

ПроМТ, Арсенал продают лучшие в мире русские машинные переводчики, для кучи языковых пар, в том числе и без русского языка. В АББИ сделали отличную распознавалку, делают машинный переводчик. Адвантис продаёт фразеологический перевод Ретранс.

На рынке полно электронных словарей (МультиЛекс, Лингво, ЭТС, пр.).

Рубрикон выставляет 50 энциклопедий с морфологизованной искалкой.

В Оракл давно уж встроен русский модуль полнотекстового поиска. Делал лингвистику для него Коваленко, а продаёт его Гарант. В Информикс русский Datablade встраивала РедЛаб. И в MS SQL Server - нами же встроен русский поиск, сходите к МедиаЛингве, почитайте на сайте.

В MS Office с 1994 года крутится моя морфология и стилистический корректор с переносами и тезаурусом.

В Экскалибур был встроен Русский семантический модуль (тоже мы делали). РБК русифицирует корпоративную Альттависту.

Ну и так далее.

А вы говорите, нет инвестиций, тишина и так далее. Люди работают.

Труды последнего, июньского "Диалога" - более 1000 страниц!

Почитайте об этих коллективах на http://www.dialog-21.ru, там же можете на еженедельный дайджест по прикладной лингвистике подписаться.

DE
На сайте с 05.04.2002
Offline
5
#16

наверно так: "люди работают". А если кто приходит со своими идеями, то он никому не интересен, потому что "юдям работающим" некогда разбираться, да и своих идей полно. Тобишь, мне похоже инвестора не найти, потому как всех уже разобрали эти "работающие люди", и с "работающими людьми" не скооперироваться, им не интересно.

Мораль - и какая мораль?

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#17

Dmitry Ermolaev

Это вы зря. Буквально год с лишним назад сюда пришел Слава Тихонов со своим поиском - теперь это поиск Пинга. Так сказать, на глазах вырос человек :). А что вам мешает?

DE
На сайте с 05.04.2002
Offline
5
#18

А почему я его не знаю? И наверно ни кто не знает.

Вот Яндекс с Апортом и Гарант+ с 1С все знают.

DE
На сайте с 05.04.2002
Offline
5
#19

Пинг это "http://topping.com.ua/"?

Да, я думаю поиск в и-нете - это еще не скоро для о-поиска будет по зубам - слишком там объемы большие и частота изменения информации высокая.

K
На сайте с 31.01.2001
Offline
737
#20
А почему я его не знаю? И наверно ни кто не знает.

Вот за других людей не надо говорить. А таких людей, как В.Тихонов, лично я уважаю - делает дело, полезное всем.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий