Search engines with key/value db

12 3
X
На сайте с 15.05.2004
Offline
16
2496

Добрый день.

Скажите, пожалуйста, кто-нибудь пользовался посковой системой Estraier (http://estraier.sourceforge.net/)? Какое впечатление от системы?

Второй вопрос: какие существуют (какие Вы знаете) хорошие поисковые системы с открытыми исходными кодами использующими базу данных key/value (почитав эту ветку форума соглашусь с людьми, которые утверждают что SQL база данных для хранения индекса вообще и большого индекса в частности не должна использоваться)?

В частности Estraier нравится тем, что использует свою, и вроде как достаточно быструю базу данных и вроде (по быстрому просмотру) не самый плохой исходный код.

Z
На сайте с 03.01.2004
Offline
32
#1

Посмотрите cache mode в DataparkSearch (http://www.dataparksearch.org/) .

X
На сайте с 15.05.2004
Offline
16
#2

Похоже на то, что надо... Только я не могу найти какую базу данных они для этого используют? Самописную?

Evg
На сайте с 12.07.2004
Offline
128
Evg
#3

Еще можно посмотрить проект:

http://aspseek.org/

libarea.ru ( https://libarea.ru/ )
X
На сайте с 15.05.2004
Offline
16
#4

Evg, в соседней ветке про выбор поисковых систем как раз читал хвалебные отзывы про этот софт... =)

Только вот с ними опять непонятно - какую базу они используют? Свою? Я не против, но даже база key/value, по-моему, не самый простой софт для написания (см. Sleepycat).

A
На сайте с 23.10.2003
Offline
196
#5

Индекс хранится не в базе.

андроид ТВ (http://qway.com.ua/android_tv) и экшн камеры (qway.com.ua/action-cameras) в Украине.
X
На сайте с 15.05.2004
Offline
16
#6

absolut, в файлах... Но ведь это тоже база данных (только очень простая)?

Evg
На сайте с 12.07.2004
Offline
128
Evg
#7

Что вы считаете " простой" базой?

Скорость индексации (использовались разные параметры) и поиска среди 5 мл. документов (данные секций для хранения, приводились к общему знаменателю), значительно превышают скорость на DataparkSearch и mnoGoSearch. Проверка производилась на "одинаковых" серверах.

X
На сайте с 15.05.2004
Offline
16
#8

Evg, под базой данных я подразумеваю в данном случае некоторый софт, который имеет операции вставки, удаления, получения и, опционально, изменения данных. Этот софт должен позволять не испытывать проблем при работе с очень большим объёмом информации и обеспечивать её (информации) целостность. Этот как раз и есть минимум - простая база данных.

Сложная - это тоже самое, плюс, например, транзакции, репликация и т.д.. Насколько мне известно из БД с такими требованиями и открытыми исходными кодами существует только Berkeley DB (http://www.sleepycat.com/docs/ref/toc.html).

К достойными представителями простых баз данных (лишёных SQL и inter process communications overhead-а), насколько я знаю, относится также и qdbm (который, по тестам быстрее BDB, подозреваю, что за счёт упрощения).

Вы можете меня подловить на том, что файловая система - тоже база данных. Да, так и есть, она заточена под другое, как и под другое заточена SQL база данных. Или я не прав? Если не прав - прошу меня поправить.

Z
На сайте с 03.01.2004
Offline
32
#9

Значительно - это сколько ? И как проводилась проверка, входило ли в сравниваемое время время расчёта релеватности для проиндексированых документов ?

X
На сайте с 15.05.2004
Offline
16
#10

Evg, да и ещё, чем не очень нравится подход ASPSeek - для её использования нужно две базы данных (SQL и их иплементация, в которой они хранят индекс) - что, с моей точки зрения, не правильно (в том числе с точки зрения использования ресурсов)...

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий