Посоветуйте поисковый движок

D
На сайте с 14.08.2006
Offline
20
3579

Народ, посоветуйте наиболее подходящий поисковый движок для сайта электронной библиотеки.

Контент - файлы txt, djvu, pdf

Объем данных - около 10 млн докум. (1 файл - 1 страница книги), 20 гб, но может и вырасти в 1.5 раза

Распределенный поиск не требуется

Переиндексация не частая (5-6 раз в году)

Сейчас все работает на FLuids, но он явно работает хуже при большом количестве данных.

Сайт будет на PHP, поэтому склоняемся к использованию Lucene (через недавно вышедший Zend_Framework для PHP5)

Может предложите какие либо ещё варианты?

P.S. Желательно бесплатные системы, но рассмотрим любые варианты.

snoopckuu
На сайте с 26.02.2006
Offline
34
#1

densilvio, Nutch

А лучше сходите на http://searchengines.o0o.ru/ тут обзоры всех открытых поисковых систем.

Разработчик поисковых систем и алгоритмов. Я умнее яндекса. Мой синонимайзер. (http://se.o0o.ru)
L
На сайте с 02.05.2004
Offline
35
#2

http://www.searchinform.com/site/ru/index.htm

Правда сие строго под виндой. Но ничего не мешает поствить рядом сервачек под виндой. С такими десткими объемами он справится легко. А его стоимость вряд ли более 110 баксов в месяц будет.

Причем данное решение в корне отличается от остальных -- благодаря поиску документов похъожих по содержанию. Можно искать сракзу и по абзацу и по странице и т.д.

А заодно отсеивать дубли при наполнении базы.

а в том что касается библиотек -- тоже опыт есть -- читайте здесь

http://www.searchinform.com/site/ru/main/search-inform-projects-biblioinform.htm

Leo www.searchinform.ru (www.searchinform.ru)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий