как быстро проиндексировать базу большого обьема?

I
На сайте с 04.09.2007
Offline
0
1382

Всем привет!

Есть база патентов. нужно реализовать поиск по этой базе.

Поиск производиться по текстовому описанию Патента.

В базе 4 000 000 патентов примечание по каждому по тенту в среднем 150 кб

Хотел использовать для индексации TF*IDF но при примерном подсчете это займет очень много времяни.

Может есть какие то другие методы индексирования которые поможат решить данную проблему?

Слава Шевцов
На сайте с 23.07.2005
Offline
370
#1

Купите готовые исходники поискового механизма и не парьтесь. Или поставьте что-то типа Яндекс.Сервер. Можете у Льва Матвеева посмотреть - они в Софтинформ что-то совершенно фантастическое наваяли именно для поиска по документам.

Неизменность точки зрения неизменно порождает иллюзию понимания.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий