Eddy

Рейтинг
1
Регистрация
28.04.2003
Должность
web-developer
Как писал Ashmanov
Спор про то, использовать ли SQL-базы для поисковых машин, как ни странно, не касается основного отличия SQL-баз от текстовых искалок.

А в чем оно состоит? 😕

Видимо, потому, что БД узко понимают как место хранения чего-то там.

Дык, а как же их еще понимать? ИМХО их только так и надо понимать. А вся бизнес-логика должна быть реализована на сервере приложений.


БД сделаны для аналитической работы с цифрами. В этом они сильны, для них написан толстый слой аналитики, гиперкубов и так далее.

Вообще говоря, это уже не СУБД, а другой класс систем типа OLAP и data mining...

Как писал Ashmanov
Увы, тут есть теоретический предел: при приближении объёмов простого текста к 10-12 Гбайт, поисковики с хранением индекса в реляционных базах перестают работать.

Эээ... стесняюсь спросить, а что это за теоретический предел такой? Предел чего?

Как писал Gray
Как мне кажется, практически все решения, использующие SQL, изначально являются надстройками над одним оператором SELECT...

Если вдуматься, что делает оператор select, то можно еще больше обобщить и углубить: практически все решения, работающие с множествами и делающие из них выборки, являются разными реализациями оператора SELECT ;)

А по сути вопроса кто-нибудь может что-нибудь сказать?

Как писал Ashmanov
Морфология в поисковике - не определяющее звено... использование словаря синонимов и тезауруса при поиске ещё никому не помогало. Это странно и обидно, но это так. Идея вроде хорошая, интуитивная. Просто в реальной обработке текста интуиция часто противоречит жизни. Обработка текстов - штука странная, часто нелепая. В поиске зачастую и морфология мешает.
Вот Гугл принципиально не использует морфологию, ищет только в заданной форме - и ничего, нормально, занял место номер 1.

В свете данных соображений, как вы относитесь к поисковым возможностям Oracle UltraSearch/Text и целесообразности использования RCO for Oracle от Гарант-Парка? Ведь для русского языка Oracle Text реализует базовые поисковые возможности, а все остальное как бы вроде и не нужно? 🙄

ЗЫ: естественно речь не идет о построении глобальной системы поиска - требуется полнотекстовый поиск в рамках корпоративной интранет сети