Flamingo, :D....
Avatar,
Из "матриц" первая действительно лучше всех.
Из киберпанка "Джонни-мнемоник" - ну, фильм хороший, но почему-то не совсем впечатляет. А вот "эквилибриум" - здорово! Почему-то у меня эти фильмы еще с "Особым мнением" связаны... ну или как там этот report перевели?
Вообще, из не совсем относящихся к киберпанку, а просто психологически страшных и сильных - могу поставить в тот же ряд "Искусственный Интеллект" (шедевр, на мой взгляд) и "Шестое чувство". А еще - "Я робот". :D
AlexA,
Правильное ранжирование - недостижимый идеалЪ :D
Я упоминала о "точном" поиске. В том же яндексе, если в запросе есть слова длиней одной буквы, поиск идет в первую очередь по ним, а ранжирование - с мелкими словами.
И вообще - в данном случае "зачем" и "загнется" - две стороны одной проблемы.
Я сама занимаюсь поисковиком, поэтому представляю многие аспекты проблемы.
Artisan,
Конечно, не имеет :) но давай не тыкать пальцами в первого на деревне спорщика :)
На восьмой опере нормально (если, конечно, не учитывать страшненький дизайн :)). Только надо дождаться догрузки страницы.
Конечно, недостаточно!
Яндекс и Гугль себе такое позволить могут. Не сравнивайте кластерную систему с одним-единственным сервером и СУБД - беркли ДБ.
Поверьте, с такой частотой слов, как служебные части речи - ваш локальный поисковик может запросто загнуться...
Кроме того, если такая часть речи встречается в НОРМАЛЬНОМ запросе, не требующем точности, она, скорее всего, учитывается только в окончательном ранжировании.
А зачем? - вот в чем вопрос? Чтоб жизнь себе усложнять и индекс увеличивать?
Нормальный человек не будет "и" вводить как ключевое слово запроса. Или вы собираетесь по нему искать? :)
Кроме того, поверьте - 3% - это ОЧЕНЬ много :)
При всем при том, 60 млн/ сек. - утопия. При остальных дисковых операциях и многопоточности поиска... или у вас получилось ? :)
4LF,
Ну, во-первых, для слов вроде предлога "и" существует стоп-лист, или просто список служебных частей речи, которые сами по себе ценности в запросе не составляют. По таким индексные пост-листы строить не стоит.
Во-вторых, если вы решили строить все на одном сервере, поможет кэширование. Если не полное - ведите умную статистику запросов, которая будет отбирать самые популярные и хранить по ним кэши. Ну, тут уж все решают ваши алгоритмы, за вас их никто не придумает...
И раз мы заговорили о кэшировании, полагаю, что механизмы кэширования легче осуществлять, наверное, на собственной СУБД...
Касперский - тормоз по жизни. На работе - фри.
Avatar, Октября...
Там лимит получается бесконечность... смущают меня 30 квадратных сантиметров... куда делись 42 кило?