Решение для индексирования?

EM
На сайте с 25.05.2006
Offline
55
EvM
1820

Предполагается создать полнотекстовый поисковый сервис на массиве из 20 000 000 документов (0.5 терабайта). Сервис должен поддерживать поиск с учетом морфологии (русской и английской) , фильтрацию и группирование по свойствам метаданных документов.

Можно ли для этих целей использовать Oracle или MS SQL 2005? Какие другие бюджетные коммерческие решения могут быть использованы для этого?

Рассматривался вариант использования Google Search Applience (стоимость решения ~ $500 000), но этот вариант не укладывается в бюджет проекта.

Скорость поиска должна быть < 3 сек. Приложение должно работать под нагрузкой ~ 100 000 запросов в сутки, ~ 20 000 новых документов в день.

K
На сайте с 11.11.2005
Offline
12
#1

EvM, А в какие пределы укладываетесь?

Если вы будете следовать инструкциям, то каждое блюдо будет получаться у вас таким же, как и у нас, даже если раньше вы никогда не занимались приготовлением пищи. Поваренная книга Мак-Колла и эпиграф Д. Кнута (http://www.turtle.ru/)
EM
На сайте с 25.05.2006
Offline
55
EvM
#2

до $100000

K
На сайте с 11.11.2005
Offline
12
#3

EvM, На сколько Вы лимитированы в сроках - ну то есть, когда по бизнес-плану должен заработать пилотный вариант. Если желаете, можете ответить мне лично на dvk гав-гав stack.net. Возможно, у нас есть для Вас хорошее решение.

E
На сайте с 11.05.2006
Offline
0
#4

EvM, Вашу задачу с высокой вероятностью решат 3-4 Яндекс.Сервера http://company.yandex.ru/technology/. В бюджет уложитесь с запасом.

S
На сайте с 21.05.2006
Offline
3
#5

А является ли Яндекс-сервер по-настоящему масштабируемым. В документации про это ничего не написано.

evening:
EvM, Вашу задачу с высокой вероятностью решат 3-4 Яндекс.Сервера http://company.yandex.ru/technology/. В бюджет уложитесь с запасом.
P
На сайте с 17.04.2006
Offline
71
#6

EvM, можно обратить внимание на FAST Data Search. Удовлетворяет всем вашим условиям, тока цена великовата - как раз от 100.000 $ . Русская морфология есть. Масштабируемость 100%, с запасом прочности так сказать.

TS
На сайте с 26.10.2004
Offline
12
TAS
#7
ppch:
EvM, можно обратить внимание на FAST Data Search.

Зачем такие монстры 😕

L
На сайте с 02.05.2004
Offline
35
#8
EvM:
Предполагается создать полнотекстовый поисковый сервис на массиве из 20 000 000 документов (0.5 терабайта). Сервис должен поддерживать поиск с учетом морфологии (русской и английской)
проекта.
...............
Скорость поиска должна быть < 3 сек. Приложение должно работать под нагрузкой ~ 100 000 запросов в сутки, ~ 20 000 новых документов в день.

http://www.searchinform.com/site/ru/index.htm

Пишите лично мне leo собака softinform точка com

Скорость поиска на таком маленьком объеме как полтера у нас будет несколько уникальных запросов в секунду, ну а если запросы будут повтряющиеся то сработает кэш -- там вообще мгновенно.

Скорость индексайии от 10 до 30 гиг в час.

На такие объемы и задачи даже с учетом тюнинга под Ваши нужды в суммы менее 100К с нами точно впишетесь и запустим вам думаю все под ключ за срок от 1 недели до 2 месяцев, если все основные требования вы в посте изложили

Leo www.searchinform.ru (www.searchinform.ru)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий