Ничего, что мы про фастранк говорим? Или нынче модно с ветряными мельницами бороться?
Илья, ну некорректно так спорить. Приписать усиленные высказывания и потом их опровергать :)
Нельзя. Но я и не собирался. Хотя бы потому что одних BM25 дофига.
Я предлагал оценивать группы факторов. Потому что единственный разумный для меня метод оценить вклад группы факторов в 40Мбайном полиноме - попытаться их обнулить. И мы, в отличие от яндексоидов, можем это делать только мысленно :)
Немного не так я формулировал. Глюков в топе полно. Но они временные. А вот попасть туда не случайно, а специально без хотя бы части слов запроса неимоверно трудно, если вообще возможно.
Если угодно - это моё оценочное суждение :)
Это попадание в индекс. Но не в топ.
Я вот тут намекал Михе как этого можно добиться:
Без раскрытия деталей. Поэтому Миха считает что так не бывает :)
Но силов на полноценный эксперимент у мну нет. В принципе, если ПФ круты, то документы можно загонять именно в топ без BM25.
Тут я с тобой соглашусь. Какие-то ПФ яндексриды могут теоретически включать в фастранк. Но практически это несколько безумная идея - без топа нет ПФ, а без ПФ нет топа. Замкнутый круг :)
Я уже раз 5 наверное отвечал на это вопрос в разных местах, в т.ч. и один раз в личке тут. Формально - это я сам так сочинил. А реально нужно внимательно читать доклад. Там нужные слова использованы в в одном абзаце, но в разделённых между собой предложениях :)
Так таки и нет? А запросы, по которым посетители переходят на документ? ;)
Не. Типа продвинуть сизого слона по запросу сизый голубь.
Без BM25 никак. Ни статвесом, ни коммерческими факторами, ни поведенческими не получится.
Ссылочным BM25 уже можно. Но его вроде как отбирают :)
Как динозавр, от которого произошла курица.
Да очень просто. Попробуйте продвинуть в ТОП сайт без BM25. Вообще без, со всеми модификациями. То есть без ключевиков в тексте и в ссылках. Не найти пример, где в топе застрял такой сайт, а преднамеренно вывести в топ заблаговременно выбранный сайт.
Если получится, Вы докажете, что BM25 не рулит и заработаете всё бабло в SEO :)
Если не получится, то вам придётся вспомнить, что сначала быстрой формулой отбирается 1000 документов по BM25, а уже потом эта тысяча (ну или сколько есть) ранжируется с помощью медленного MatrixNet, то есть с использованием 800±50 факторов.
То есть BM25 первичен по определению.
Ну, пока работают бонусы за новизну в топ вылезают достаточно левые новости/свежие документы. Это факт.
Опять же не забываем про переколдовку - в топ можно попасть с помощью синонимов и расширителей а ля "своими руками". Которые не всегда очевидны, если не сказать больше - иногда весьма косячны.
Если исключить эти два варианта, то сомневаюсь что можно в топ без BM25 (с учётом модификаций) попасть.
Я это знаю :) Документ без ключевика ты одними ПФ в топ на постоянной основе не загонишь.
Директ - это источник трафика, для которого можно замерять ПФ. Если ПФ хорошие - то будет рост. Небольшой. Потому что BM25 вносит гораздо больший вклад в ранжирование, чем ПФ.
А вы знаете как эффективно улучшать ПФ? Доклад яндекса практически отрытым текстом даёт советы... И да, про винлокер и ролик с порнухой там ни слова :)