lagif

lagif
Рейтинг
30
Регистрация
15.12.2004
Должность
Программер
Интересы
Идеи
Которая

Flamingo, :D....

Avatar,

Из "матриц" первая действительно лучше всех.

Из киберпанка "Джонни-мнемоник" - ну, фильм хороший, но почему-то не совсем впечатляет. А вот "эквилибриум" - здорово! Почему-то у меня эти фильмы еще с "Особым мнением" связаны... ну или как там этот report перевели?

Вообще, из не совсем относящихся к киберпанку, а просто психологически страшных и сильных - могу поставить в тот же ряд "Искусственный Интеллект" (шедевр, на мой взгляд) и "Шестое чувство". А еще - "Я робот". :D

AlexA,

Правильное ранжирование - недостижимый идеалЪ :D

AlexA,

Я упоминала о "точном" поиске. В том же яндексе, если в запросе есть слова длиней одной буквы, поиск идет в первую очередь по ним, а ранжирование - с мелкими словами.

И вообще - в данном случае "зачем" и "загнется" - две стороны одной проблемы.

Я сама занимаюсь поисковиком, поэтому представляю многие аспекты проблемы.

Artisan,

Конечно, не имеет :) но давай не тыкать пальцами в первого на деревне спорщика :)

На восьмой опере нормально (если, конечно, не учитывать страшненький дизайн :)). Только надо дождаться догрузки страницы.

AlexA,

Конечно, недостаточно!

Яндекс и Гугль себе такое позволить могут. Не сравнивайте кластерную систему с одним-единственным сервером и СУБД - беркли ДБ.

Поверьте, с такой частотой слов, как служебные части речи - ваш локальный поисковик может запросто загнуться...

Кроме того, если такая часть речи встречается в НОРМАЛЬНОМ запросе, не требующем точности, она, скорее всего, учитывается только в окончательном ранжировании.

AlexA,

А зачем? - вот в чем вопрос? Чтоб жизнь себе усложнять и индекс увеличивать?

Нормальный человек не будет "и" вводить как ключевое слово запроса. Или вы собираетесь по нему искать? :)

Кроме того, поверьте - 3% - это ОЧЕНЬ много :)

При всем при том, 60 млн/ сек. - утопия. При остальных дисковых операциях и многопоточности поиска... или у вас получилось ? :)

4LF,

Ну, во-первых, для слов вроде предлога "и" существует стоп-лист, или просто список служебных частей речи, которые сами по себе ценности в запросе не составляют. По таким индексные пост-листы строить не стоит.

Во-вторых, если вы решили строить все на одном сервере, поможет кэширование. Если не полное - ведите умную статистику запросов, которая будет отбирать самые популярные и хранить по ним кэши. Ну, тут уж все решают ваши алгоритмы, за вас их никто не придумает...

И раз мы заговорили о кэшировании, полагаю, что механизмы кэширования легче осуществлять, наверное, на собственной СУБД...

Касперский - тормоз по жизни. На работе - фри.

Avatar, Октября...

Там лимит получается бесконечность... смущают меня 30 квадратных сантиметров... куда делись 42 кило?

Всего: 745