Официальные поведенческие факторы Яндекса - обсудим?

Chikago
На сайте с 24.10.2007
Offline
227
#231
yanus:
Чего вдруг?

Все, что увеличивает время нахождения юзера на странице и все такое.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#232
YaanGle:
Вы так и не ответили на множество вопросов о том, где Вы получили расшифровку некоторых обозначенных признаков.

Я уже раз 5 наверное отвечал на это вопрос в разных местах, в т.ч. и один раз в личке тут. Формально - это я сам так сочинил. А реально нужно внимательно читать доклад. Там нужные слова использованы в в одном абзаце, но в разделённых между собой предложениях :)

Chessmaster
На сайте с 28.12.2006
Offline
257
#233
Я уже раз 5 наверное отвечал на это вопрос в разных местах, в т.ч. и один раз в личке тут. Формально - это я сам так сочинил. А реально нужно внимательно читать доклад. Там нужные слова использованы в в одном абзаце, но в разделённых между собой предложениях

Язык математики скучен и мало понятен. Вон школота тырит фильм, копипастит к нему текст и картинку и народ валом валит. ПФ аж кипит! У Яндекса из ушей пар идёт 😂 Может нам лучше у них учиться продвижению? 😂

Просто сидишь и ждешь? Чуда не будет. Учись зарабатывать. Некоторые монеты вырастут в цене в 10 раз. Удачи! https://kriptovalyta.ru
G00DMAN
На сайте с 19.04.2008
Offline
122
#234
AiK:
Да очень просто. Попробуйте продвинуть в ТОП сайт без BM25. Вообще без, со всеми модификациями. То есть без ключевиков в тексте и в ссылках. Не найти пример, где в топе застрял такой сайт, а преднамеренно вывести в топ заблаговременно выбранный сайт.

Если получится, Вы докажете, что BM25 не рулит и заработаете всё бабло в SEO :)

Если не получится, то вам придётся вспомнить, что сначала быстрой формулой отбирается 1000 документов по BM25, а уже потом эта тысяча (ну или сколько есть) ранжируется с помощью медленного MatrixNet, то есть с использованием 800±50 факторов.

То есть BM25 первичен по определению.

Не, всё немного не так.

Во-первых твоя метрика "важности" хреновая, т.к. хз, как по ней сравнивать два произвольных фактора.

Во-вторых, утверждение "без слов запроса не может быть в топе" не верно. Это, например, ещё три года назад показал Гугл, подловив Бинг: Google обвиняет Bing в копировании его поисковой выдачи. У Бинга алгоритмы ранжирования похожи на яндексовские, только факторов ещё больше. :D

В третьих, на этапе фастранка в формуле вполне могут быть и ПФ, почему бы и нет?

Ramiil:
Если не ошибаюсь, то анкорный и текстовый корпус складывались при расчете по формуле ВМ25

Ошибаетесь. Факторов, которые рассчитываются по BM25 в матрикснете много разных, больше 4-х десятков, по тексту, по тайтлу, по анкорам, по текст+анкоры (они называют это "монолитный индекс") и пр.

Фраза "текстовый корпус" режет глаз. "Корпус" в поисковой науке - то же самое, что и "коллекция", а в данном случае коллекция чего? Предложений, чтоле? :)

Илья Зябрев, AlterTrader Research Ltd. Последние статьи: Об отмене ссылок в Яндексе. (www.altertrader.com/publications38.html)|Поведенческие факторы (формулы) (www.altertrader.com/publications36.html) Жадные алгоритмы Яндекса. (www.altertrader.com/publications20.html)|MatrixNet для «чайников». (www.altertrader.com/publications19.html)
Химик78
На сайте с 16.10.2009
Offline
161
#235

AiK, а как вот эта штука практически может быть определена?

AiK:
QueryDomCTR — среднее значение CTR всех документов домена по данному запросу

Например, если на сайте есть 10k документов, релевантных запросу, то в выдаче ведь показывается только один, а для [большинства] остальных документов CTR вообще не может быть определен, т.к. нет возможности их все показать в выдаче.

Это точно не "среднее значение CTR всех документов домена по всем запросам"?

proshin.ru (http://proshin.ru/services/) - аудит сайтов, продвижение, контекстная реклама и пр.
dlyanachalas
На сайте с 15.09.2006
Offline
693
#236
G00DMAN:
В третьих, на этапе фастранка в формуле вполне могут быть и ПФ, почему бы и нет?

Потому "нет", что это - "фастранк". Там ничего кроме самых элементарных сравнений быть не может.

---------- Добавлено 13.01.2014 в 18:54 ----------

G00DMAN:


В третьих, на этапе фастранка в формуле вполне могут быть и ПФ, почему бы и нет?
Ошибаетесь. Факторов, которые рассчитываются по BM25 в матрикснете много разных, больше 4-х десятков, по тексту, по тайтлу, по анкорам, по текст+анкоры (они называют это "монолитный индекс") и пр.

Нет смысла выдумывать. Если ключа не будет ни в тексте, ни в ссылках, документ никогда не попадет в выборку для пост-ранжирования.

Это очевидный факт, основанный на фундаментальных принципах ПС.

[Удален]
#237
dlyanachalas:
Нет смысла выдумывать. Если ключа не будет ни в тексте, ни в ссылках, документ никогда не попадет в выборку для пост-ранжирования.

например: Простой BM25 c учетом синонимов :)

U
На сайте с 16.11.2008
Offline
66
#238

Разбавленная выдача с учетом вероятной опечатки принесет вообще левые документы

G00DMAN
На сайте с 19.04.2008
Offline
122
#239
dlyanachalas:
Потому "нет", что это - "фастранк". Там ничего кроме самых элементарных сравнений быть не может.

Ну так а я о чём? Или вы считаете, что "CTR по запросу" гораздо сложнее, чем "BM25 по запросу"? :)

И, кстати - в случае, если на одной ноде слишком много релевантных ответов, то документы из вчерашнего топа могут просто не попасть в отдачу фастранка, если не учитывать ПФ. :)

dlyanachalas:
Нет смысла выдумывать. Если ключа не будет ни в тексте, ни в ссылках, документ никогда не попадет в выборку для пост-ранжирования.

Это очевидный факт, основанный на фундаментальных принципах ПС.

Я вроде выше привёл ссылку на старый гугло-кипеш, которая опровергает ваш "фундаментальный принцип". Гугл загонял в выдачу Бинга кучу документов без вхождения в текст и ссылки. :)

YaanGle
На сайте с 06.09.2011
Offline
155
#240
G00DMAN:
Ну так а я о чём? Или вы считаете, что "CTR по запросу" гораздо сложнее, чем "BM25 по запросу"? :)

Считать сложнее не будет, но что тогда будет с полнотой ответа? :)

G00DMAN:

Я вроде выше привёл ссылку на старый гугло-кипеш, которая опровергает ваш "фундаментальный принцип". Гугл загонял в выдачу Бинга кучу документов без вхождения в текст и ссылки. :)

По сути это тоже текстовый индекс для документа, только запросовый :) Правда, здесь получается положительная обратная связь - показываешь документ в выдаче - индекс пополняется, даже если сама информация уже изменилась.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий