Keva

Рейтинг
80
Регистрация
27.11.2000
Интересы
Software development, linguistics, BMW, dogs, girls ;-)

Originally posted by AiK:
А в рамблере как этого добится я не знаю, да и не хочу этого знать - быстрее к конкурентам обратиться.

Ключевое словосочетание здесь - "не знаю, да и не хочу этого знать"

А делается это в Рамблере ну просто самым очевидным и интуитивным образом, который вдобавок подробно описан - просто надо заключить в кавычки или слово, или всю фразу для поиска на точное ее вхождение.

Попробуйте на досуге На всякий случай подсказываю - запрос "человек года"

В точку! wolf, ты нас раскрыл!!! Операции суммирования и умножения действительно используются, причем достаточно часто!

Вы бы на конструктивную критику поадекватнее реагировали бы.

Да нет, на конструктивную критику я как раз реагирую обычно конструктивно. А так реагирую как раз на голословную

Но, если закончить бодания и говорить конструктивно, то вот что получится.

У Рамблера есть недостатки, и мы, как ты понимаешь, о них знаем. Это редкое обновление базы и наличие страниц, которые уже стали недоступны, но мы об этом не знаем. Или делаем вид, что не знаем

Но вот насчет релевантности - тут ты неправ. Сначала Ашманов, потом - я некоторое время назад предлагали участникам форума позаниматься сравнительными оценками полноты базы и релевантности выдачи русских поисковых машин. Однако все застопорилось, напомню, на том, что не смогли выбрать методику, по которой проводить эти оценки.

Так, для оценки размера индекса Илья (iseg) предлагал выполнять запросы по редким словам; Игорь публиковал методику оценки релевантности выдачи; все дружно это обсуждали - но так это и заглохло. А жаль.

Так вот, мы постоянно занимаемся внутренним мониторингом релевантности выдачи и Яndex'а, и Рамблера, и Апорта. Я, конечно, могу опубликовать цифры, но они имеют смысл только в контексте применяемой методики.

Поэтому предлагаю заинтересованным поставить самый простой эксперимент в домашних условиях (ну, или в рабочих, если Инет - на работе ).

Суть его проста. Вот сейчас закончился первый тур кубка Яndex'а, и доступны записи всех пяти или шести проводившихся игр. Надо взять любую из них и ответить на предлагаемые Кубком Яndex'а двадцать вопросов, используя три наши русские поисковые машины. В каждом случае следует отмечать для себя, каким по счету в выдаче был документ, содержащий правильный ответ на вопрос, и сколько (визуально) мусора было на первой странице.

Эксперимент этот, конечно, не будет чистым - запросы-то каждый будет давать свои, но впечатление общее сложиться должно...

Можно, конечно, отнестись предвзято и, скажем, поискать Виагру в Рамблере по запросу "Виагра", а в Апорте по запросу "реферат", после чего прийти к выводу, что "Апорт ни фига не ищет" , однако я просто пытаюсь быть конструктивным

В точку! wolf, ты нас раскрыл!!! Операции суммирования и умножения действительно используются, причем достаточно часто!

Вы бы на конструктивную критику поадекватнее реагировали бы.

Да нет, на конструктивную критику я как раз реагирую обычно конструктивно. А так реагирую как раз на голословную

Но, если закончить бодания и говорить конструктивно, то вот что получится.

У Рамблера есть недостатки, и мы, как ты понимаешь, о них знаем. Это редкое обновление базы и наличие страниц, которые уже стали недоступны, но мы об этом не знаем. Или делаем вид, что не знаем

Но вот насчет релевантности - тут ты неправ. Сначала Ашманов, потом - я некоторое время назад предлагали участникам форума позаниматься сравнительными оценками полноты базы и релевантности выдачи русских поисковых машин. Однако все застопорилось, напомню, на том, что не смогли выбрать методику, по которой проводить эти оценки.

Так, для оценки размера индекса Илья (iseg) предлагал выполнять запросы по редким словам; Игорь публиковал методику оценки релевантности выдачи; все дружно это обсуждали - но так это и заглохло. А жаль.

Так вот, мы постоянно занимаемся внутренним мониторингом релевантности выдачи и Яndex'а, и Рамблера, и Апорта. Я, конечно, могу опубликовать цифры, но они имеют смысл только в контексте применяемой методики.

Поэтому предлагаю заинтересованным поставить самый простой эксперимент в домашних условиях (ну, или в рабочих, если Инет - на работе ).

Суть его проста. Вот сейчас закончился первый тур кубка Яndex'а, и доступны записи всех пяти или шести проводившихся игр. Надо взять любую из них и ответить на предлагаемые Кубком Яndex'а двадцать вопросов, используя три наши русские поисковые машины. В каждом случае следует отмечать для себя, каким по счету в выдаче был документ, содержащий правильный ответ на вопрос, и сколько (визуально) мусора было на первой странице.

Эксперимент этот, конечно, не будет чистым - запросы-то каждый будет давать свои, но впечатление общее сложиться должно...

Можно, конечно, отнестись предвзято и, скажем, поискать Виагру в Рамблере по запросу "Виагра", а в Апорте по запросу "реферат", после чего прийти к выводу, что "Апорт ни фига не ищет" , однако я просто пытаюсь быть конструктивным

Рамблер и Яndex относятся индифферентно Они просто meta keywords игнорируют

Originally posted by wolf:
Не так уж долго и не так уж сложно для человека, немного разбирающегося в математике. Вы алгоритмик откройте, а дальше уже наши проблемы.

Хорошо. Ты хотел "магическую формулу"? Пожалуйста! Вот формула, которая вовсю используется при вычислении релевантности документа: Pi+1 = 1 - (1 - Pi)(1 - f). Выполняется итеративно по всем вхождениям слова. Pi+1 - вероятность релевантности на i+1-м шаге, Pi, как можно догадаться - на i-м , f - очередной вклад в общую вероятность релевантности документа запросу.

Ну и как, легче стало? А теперь открой учебник по терверу (любой) и посмотри в самом начале...

Ну как, нашел эту формулу? :-)

Originally posted by wolf:
А то, что в Рамблере никакой "формулы релевантности" нету - и так ясно, потому как релевантности как таковой в его результатах поиска обнаружить невозможно.

Ага. Также очень полезно громко заявить, например, что Бога нет

С уважением, Андрей Коваленко, Рамблер.

Originally posted by wolf:
Не так уж долго и не так уж сложно для человека, немного разбирающегося в математике. Вы алгоритмик откройте, а дальше уже наши проблемы.

Хорошо. Ты хотел "магическую формулу"? Пожалуйста! Вот формула, которая вовсю используется при вычислении релевантности документа: Pi+1 = 1 - (1 - Pi)(1 - f). Выполняется итеративно по всем вхождениям слова. Pi+1 - вероятность релевантности на i+1-м шаге, Pi, как можно догадаться - на i-м , f - очередной вклад в общую вероятность релевантности документа запросу.

Ну и как, легче стало? А теперь открой учебник по терверу (любой) и посмотри в самом начале...

Ну как, нашел эту формулу? :-)

Originally posted by wolf:
А то, что в Рамблере никакой "формулы релевантности" нету - и так ясно, потому как релевантности как таковой в его результатах поиска обнаружить невозможно.

Ага. Также очень полезно громко заявить, например, что Бога нет

С уважением, Андрей Коваленко, Рамблер.

Говорю как большой любитель клеить девушек в Сети (весьма, кстати, благодарное занятие - я забыл о том, что бывают одинокие ночи ) - зря ты этим занялся. Сайтов знакомств - туева хуча, но реально работает только один - Missing Heart (www.mheart.ru), да и то потому, что тщательно модерасится руками.

<font face="Verdana" size="2">Originally posted by paul:
Во-первых, отлавливается символ переноса строки
</font>

... и еще кое-что

<font face="Verdana" size="2">
во-вторых, длина title не больше 256 символов
</font>

И порог длины тоже есть, ошибка только в цифре

<font face="Verdana" size="2">
в-третьих, количество повторений слов в одной форме не больше.... пяти.
</font>

И слова повторяющиеся тоже считаем Откуда, правда, цифра "пять" - непонятно, но некоторый динамический порог есть.

И еще кое-какие проверки выполняются

С уважением, Андрей Коваленко,

Рамблер.

Заметим также, что и Рамблер устойчиво игнорирует &lt;meta keywords=...&gt;

Также мы используем алгоритмы автоматического опеределения спамерских &lt;title&gt;, какие - не скажу , и постоянно их накручиваем.

С уважением, Андрей Коваленко,

Рамблер.

<font face="Verdana" size="2">Originally posted by puk:

...
В Гугле хоть можно запретить кэшировать страницы, а в Рамблере?

</font>

В Рамблере (пока) нельзя, но мы работаем .

С уважением, Андрей Коваленко,

Рамблер.

Всего: 238