Не только крут, но и могуч. Не каждому дано вырастить свой кормящий фан-клуб. :)
Конверт посчитать будет сложно, т.к. не все побегут в Сеопульт сразу. Но в целом должно получиться не совсем кисло, как я думаю.
Факторы коррелировать не могут, иначе они бы не брались в модель.
Я уже писал, что поведенческих факторов у Яндекса много, есть и зависящие от конкретной пары (запрос, документ), есть и средние по хосту, есть и по урлу.
Свежие мысли можно в более правильных местах искать, например на РОМИПе. В этом году Яндекс сделал доклад по поиску дубликатов: Поиск похожих изображений и дубликатов (слайды). Там вроде достаточно подробно расписано, что и как делается.
Мой находит гудмана в кадре, умный гад. :)
В ветке уже не раз упоминалась книга: Кристофер Д. Маннинг, Прабхакар Рагхаван, Хайнрих Шютце "Введение в информационный поиск". Это на сегодня единственная современная книга о писке на русском, больше книг нет. Книга актуальная, в оригинале она вышла 2008 году. Кроме большого объема информации в книге есть также замечательная библиография, большинство знаковых трудов по поиску в нее вошли. Полезно читать всем.
Из статей на русском можно смотреть сборники докладов на семинарах РОМИП, RCDL и Диалог.
Есть поводы вернуться к теме ветки. :)
Я вот забыл еще Диалог упомянуть, Вы читаете труды оттуда?
Вот например труды 2010 года.
Понятно, что там разного качества статьи, хотя наверняка есть и интересные. Типа таких:
Метод определения массово порождаемых неестественных текстов - понятно, про что это. :D
КОМПИЛЯЦИЯ ИЛИ… ЯЗЫКОВЫЕ КЛИШЕ? - попытки определения авторства.
На сегодня информация изменилась - в триграммы копать нужно. :)
юни,вот когда Кокос сделает свой поисковик и будет говорить про его ранжирование - тогда и послушаем. А пока не интересно ни разу. :)
юни, да и пусть себе говорит.
Достоверно известно, что Яндекс собирает поведенческие данные из:
Данных из этих источников собирается много и на них строится очень много факторов, десятки, если не больше.
Все полученные факторы влияют на выдачу. Поэтому вопрос о том, что ставить на сайт, метрику или LI, не имеет однозначного ответа. Иногда не стоит ставить ни одного, ни другого. :)
Медведев клоноводит:
Дмитр Медвед
Дмитр Анатол
Но его кореша с клонами френдиться не хотят почему-то. :D
webpavilion, на самом деле что там Яндекс купил - дело темное, не все так просто... :)