Что-то мне подсказывает, что Вам никогда не стать руководителем поиска Яндекса. :)
Я думаю, если б Вы были руководителем Яндекс-поиска, то мысль о мелкой лжи Вам просто не пришла бы в голову.
Экак Вы с ходу определили. :)
Не путайте выдачу с галочкой и выдачу по умолчанию
Можно и штаны через голову надевать. Не знаю, что у Вас там на что похоже, но иногда, чтоб не выглядеть смешным, лучше ознакомиться с теорией. Функцию от заявленных тысяч параметров ни с какого нуля не построить. Здесь возможно только обучение и только генетика.
Дык здесь под greedy algorythm наверняка подразумевается жадная генетика. Ну, это когда жадный алгоритм используется для получения нового поколения в генетическом алгоритме.
Хм... А зачем сравнивать метрику с алгоритмом? В той же презентации Гулина и Карповича приведены примеры по крайней мере четырех метрик. И теоретически ничто не мешает использовать и pfound вместе с жадным алгоритмом (кстати, откуда уверенность, что жадный алгоритм не используется в Арзамасе?). Вместе с тем, я не уверен, что в Арзамасе используется именно pfound. Предполагаю, что эту метрику использовали чисто для РОМИПа. Т.к. для поиска по вебу, на мой взгляд, недостаточно максимизации вероятности найти один релеватный документ. Надо обеспечить максимально релевантную выдачу хотя бы в первой десятке.
Это можно сказать о любом генетическом алгоритме.
Осмелюсь поинтересоваться, а как в алгоритме "Learning to Rank", на который Яндекс прочно подсел уже пару лет как, могут не участвовать оценки асессоров сиречь обучающая выборка? Или Вы можете предложить, как строить ранжирующую функцию от нескольких тысяч параметров каким-то иным способом? Если да, то Вам надо его срочно запатентовать, это будет революция в Information Retrieval :)
Да-да, Расковалова на ночь тоже читаем ;)
А каким образом анкоры влияют на ТИЦ???
Вообще-то, выдача для "Москвы" (lr=213) и "Москвы и области" (lr=1) должна быть одинакова
Справедливости ради стоит отметить, что сейчас режим "Сохраненная копия" не всегда показывает именно сохраненную копию. Иногда там показывается текущая версия страницы, берущаяся на лету с хостинга.