Ключевое словосочетание здесь - "не знаю, да и не хочу этого знать"
А делается это в Рамблере ну просто самым очевидным и интуитивным образом, который вдобавок подробно описан - просто надо заключить в кавычки или слово, или всю фразу для поиска на точное ее вхождение.
Попробуйте на досуге На всякий случай подсказываю - запрос "человек года"
В точку! wolf, ты нас раскрыл!!! Операции суммирования и умножения действительно используются, причем достаточно часто!
Да нет, на конструктивную критику я как раз реагирую обычно конструктивно. А так реагирую как раз на голословную
Но, если закончить бодания и говорить конструктивно, то вот что получится.
У Рамблера есть недостатки, и мы, как ты понимаешь, о них знаем. Это редкое обновление базы и наличие страниц, которые уже стали недоступны, но мы об этом не знаем. Или делаем вид, что не знаем
Но вот насчет релевантности - тут ты неправ. Сначала Ашманов, потом - я некоторое время назад предлагали участникам форума позаниматься сравнительными оценками полноты базы и релевантности выдачи русских поисковых машин. Однако все застопорилось, напомню, на том, что не смогли выбрать методику, по которой проводить эти оценки.
Так, для оценки размера индекса Илья (iseg) предлагал выполнять запросы по редким словам; Игорь публиковал методику оценки релевантности выдачи; все дружно это обсуждали - но так это и заглохло. А жаль.
Так вот, мы постоянно занимаемся внутренним мониторингом релевантности выдачи и Яndex'а, и Рамблера, и Апорта. Я, конечно, могу опубликовать цифры, но они имеют смысл только в контексте применяемой методики.
Поэтому предлагаю заинтересованным поставить самый простой эксперимент в домашних условиях (ну, или в рабочих, если Инет - на работе ).
Суть его проста. Вот сейчас закончился первый тур кубка Яndex'а, и доступны записи всех пяти или шести проводившихся игр. Надо взять любую из них и ответить на предлагаемые Кубком Яndex'а двадцать вопросов, используя три наши русские поисковые машины. В каждом случае следует отмечать для себя, каким по счету в выдаче был документ, содержащий правильный ответ на вопрос, и сколько (визуально) мусора было на первой странице.
Эксперимент этот, конечно, не будет чистым - запросы-то каждый будет давать свои, но впечатление общее сложиться должно...
Можно, конечно, отнестись предвзято и, скажем, поискать Виагру в Рамблере по запросу "Виагра", а в Апорте по запросу "реферат", после чего прийти к выводу, что "Апорт ни фига не ищет" , однако я просто пытаюсь быть конструктивным
Рамблер и Яndex относятся индифферентно Они просто meta keywords игнорируют
Хорошо. Ты хотел "магическую формулу"? Пожалуйста! Вот формула, которая вовсю используется при вычислении релевантности документа: Pi+1 = 1 - (1 - Pi)(1 - f). Выполняется итеративно по всем вхождениям слова. Pi+1 - вероятность релевантности на i+1-м шаге, Pi, как можно догадаться - на i-м , f - очередной вклад в общую вероятность релевантности документа запросу.
Ну и как, легче стало? А теперь открой учебник по терверу (любой) и посмотри в самом начале...
Ну как, нашел эту формулу? :-)
Ага. Также очень полезно громко заявить, например, что Бога нет
С уважением, Андрей Коваленко, Рамблер.
Говорю как большой любитель клеить девушек в Сети (весьма, кстати, благодарное занятие - я забыл о том, что бывают одинокие ночи ) - зря ты этим занялся. Сайтов знакомств - туева хуча, но реально работает только один - Missing Heart (www.mheart.ru), да и то потому, что тщательно модерасится руками.
... и еще кое-что
И порог длины тоже есть, ошибка только в цифре
И слова повторяющиеся тоже считаем Откуда, правда, цифра "пять" - непонятно, но некоторый динамический порог есть.
И еще кое-какие проверки выполняются
С уважением, Андрей Коваленко,
Рамблер.
Заметим также, что и Рамблер устойчиво игнорирует <meta keywords=...>
Также мы используем алгоритмы автоматического опеределения спамерских <title>, какие - не скажу , и постоянно их накручиваем.
В Рамблере (пока) нельзя, но мы работаем .