Поисковик для форума

С
На сайте с 31.10.2005
Offline
10
736

Создаём форум и хотим использовать готовый поисковик с открытым кодом, прежде доработав его. Платный или бесплатный - не важно. В том числе доработав алгоритм ранжирования. Какие есть требования:

  • платформа Linux - Apache - MySQL (или текстовая база);
  • формат сообщений - html или xml;
  • мультиязычность и учёт языка в выдаче;
  • часть сообщений может быть ищущему не видна (следствие наличия системы прав доступа к сообщениям);
  • есть ссылочное ранжирование. Ссылки из внешнего интернета не учитываются, ссылки из профайлов не учитываются, ссылки из заданных форумов (например, юмор) не учитываются, ссылки подпадающие под некоторые шаблоны не учитываются и не обрабатываются (например, если в ссылке есть текст "viewprofile=", то она не учитывается);
  • есть ранжирование на основе оценок блокам информации: каждый читатель может поставить блоку информации свою оценку, оценки разных пользователей суммируются;
  • есть ранжирование на основе авторитетности автора (авторитетность измеряется в баллах);
  • скорее всего при ранжировании будем учитывать и количество просмотров сообщения;
  • масштабируемость до 10-100 млн. сообщений при размере сообщения 0.5-2 Кб;
  • при добавлении сообщения оно автоматически должно оказываться в поисковом индексе, а глобальный пересчёт ссылочного и оценочного ранжирования остальных сообщений можно оставлять на ночь.

То есть требуется такое вот ссылочное ранжирование и ограничение выдачу с правами доступа. Какой из поисковых движков посоветуете взять за основу?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий