Можно ещё посмотреть DataparkSearch, http://www.dataparksearch.org/
Правда со стабильностью у него: кто жалуется, а у кого и нормально работает, как повезёт :)
Google и Verity участвоали в TREC-5 и TREC-6 соответвенно. См. http://trec.nist.gov
Исследовательские проекты на базе dtsearch - в TREC-12, может еще когда. Смотрите подробне на выше указаном сайте.
Да я не против, только как докажите ? :)
так тесты нужны в сравнении с другими системами, а не сами по себе ☝
OFFSET есть начиная с версии 4.0.6
http://dev.mysql.com/doc/refman/4.1/en/news-4-0-6.html
Хм, а вы его на какой операционке юзаете ? У меня на FreeBSD, работает стабильно. Хотя может к чему уже и привык, как к тому же слэшу в конце урла :) Ну а список глюков отправить разработчику - чуть ли не единственный способ от них избавиться в следующих версиях :d
Странный вопрос, это вы писали о качественном поиске, вам и расшифровывать, что вы в это понятие вкладываете, именно об этом я вас и спросил, заодно в сравнение с такими же метриками для других поисковиков.
Стандартные метрики:
http://en.wikipedia.org/wiki/Information_retrieval#Performance_measures
Одной скорости тут мало :)
А качество поиска как мерили ? :d
http://www.mnogosearch.org/
http://www.dataparksearch.org/
Оба умею индексировать прямо из БД, оба GPL. dataparksearch есть в портах FreeBSD www/dpsearch
Если действительно хотите впоследствии юзать Оракл, то тогда пробуйте mnogosearch.
Боюсь, что этот поисковик работает далеко не на всех броузерах, в том числе и от MS. С релевантностью у него не очень, во всяком случае, хоть и видно отличие от гугла (просто оличие, во всяком случае не скажу, что в лучшую сторону), - не впечатляет...
http://blogsearch.google.com/
http://blogs.yandex.ru/
http://www.feedster.com/
http://www.technorati.com/
Понятно, спасибо.
А "Phrase search" и "All words must present in result" в резульатах тестирования что означают ? Если поиск ведётся как точное вхождение фраз из запроса, то второе как бы само собой подразумевается.
И ещё один момент: при поиске английская морфология учитывалась ?