object

Рейтинг
42
Регистрация
17.05.2009
Слава Шевцов:
А Вас так сильно напрягает размер индекса?

В общем-то, нет – есть небольшой резерв (100 Мб). Боюсь потерей в узком месте input/output, это же фс. Все-таки хочется ориентироваться на лучшие образцы, но это непросто.

HraKK:
Не пишите велосипеды, используйте sphinx.
С Вас 10$ за наводку.

Не подходит, у меня windows и опять же не доверяю зарубежным аналогам, только что отложил в сторону Lucene, а жаль - хороший движок, но проблема с русским.

Слава Шевцов:
object, стемку используете, чтобы уменьшить число "уникальных" слов?

Стемминг используется, но всего не может решить, нужен алгоритм отсева "ненужных" слов.

Всего: 52