Я поведал немного раньше. И в планы Расковалова, увы, не вхож. :)
А кто заявлял про 300-ю степень? Размерность - это число переменных, вообще-то.
И что за основания, если не секрет? Почему мономы содержат не более двух переменных? И почему степень каждой переменной не больше единицы?
Вот-вот. Вообще, полагаю, что нет никакой отдельной специальной формулы для оператора url, которая якобы ранжирует чисто "по трасту". Ранжирование идет по общей формуле, где термином запроса является адрес документа и поиск осуществляется в поисковой зоне "адрес документа". Ну, как оператор title ищет только в поисковой зоне "заголовок документа". Поэтому на ранжирование могут влиять самые разнообразные факторы, входящие в общую формулу. Наверняка пресловутый "траст" входит в их число, но он явно не одинок.
Вы можете думать, что угодно, но для меня эта зависимость очевидна.
Полагаете, каждый апдейт надо заново вычислять ранжирующие функции? С Вами бы Яндекс по миру пошёл... :)
Вы мыслите категориями классической аппроксимации. Именно для того и используют генетические алгоритмы, чтоб обойти эти узкие места
Почему? Насколько я понимаю, поиск функции наилучшего приближения в виде полинома с наименьшим числом членов и достаточно большим числом независимых переменных при малом числе измерений - это стандартная задача для генетических алгоритмов. Другое дело, конечно, точность.
Я не отвечаю за качество стенограммы ;)
Не только коэффициенты. Генетическим алгоритмом также выбирается и вид полинома.
В конкурентных топах, в отличие от оператора url, есть еще и более сильная зависимость от кол-ва употреблений терминов из запроса. Это во-первых. А во-вторых, я не говорил, что зависимость от длины документа обязательно обратная ;)
Применяли на больших размерностях?
Читаем "Яндекс на РОМИП'2009". Ну, и западную литературу по "Learning to Rank"
Я этого не говорил