Формула расчета кворума от Дена Расковалова

1 2345 6
G00DMAN
На сайте с 19.04.2008
Offline
122
#21
mikes:
Но огорчают принципиальные ограничения MatrixNet'а. Например, жесткая зависимость качества от количества и глубины оценок, что приводит к плохому ранжированию по длинным НЧ (а это половина трафика, на минуточку). По сути, MatrixNet хорошо справляется с переранжированием уже неплохой выдачи. Но что делать, если хороший ответ на запрос остался вне поля внимания асессора? Насколько я понял, задач вида "найти лучший ответ на запрос" у асессоров сейчас нет.

Не, все как раз наоборот. :)

Понятно, что любая сегодняшняя формула ранжирования имеет проблемы именно вне "обученных" запросов. Но, если говорить о Яндексе, то Матрикснет как раз и отличается от прошлых полиномов типа Арзамаса тем, что гораздо лучше экстраполируется на весь пул запросов. Это по оценкам Яндекса, конечно, другие внятные оценки не известны, субъективные не катят. :)

Ну и что касается ранжирования на обученных коммерческих запросах - там-то как раз и траблы. Качество хорошее с т.з. пифаунда и убогое с т.з. здравого смысла и реалий. :D

богоносец:
Не «не хочет», а не может...

Мог бы пытаться, но пока интереса не видно, по крайней мере с моей деревенской колокольни. :)

mikes:
Ну, есть безусловно сильные решения. Например, переход от pagerank к browserank. Не все так плохо ;)

Что за переход? Пэйджранк до сих пор является одним из важных факторов ранжирования в Яндексе, хотя и не самым топовым. Хотя торжественное заявление Садовского "Матрикснет победил пэйджранк" - это не успех, а беда ранжирования. Плохо, что не все в Яндексе это понимают. :)

mikes:
Больше. Половина запросов - под планкой 30 в вордстате

По количеству уникальных запросов - больше, по доле этих НЧ в логах - меньше.

Илья Зябрев, AlterTrader Research Ltd. Последние статьи: Об отмене ссылок в Яндексе. (www.altertrader.com/publications38.html)|Поведенческие факторы (формулы) (www.altertrader.com/publications36.html) Жадные алгоритмы Яндекса. (www.altertrader.com/publications20.html)|MatrixNet для «чайников». (www.altertrader.com/publications19.html)
mikes
На сайте с 20.02.2006
Offline
106
#22
G00DMAN:
Но, если говорить о Яндексе, то Матрикснет как раз и отличается от прошлых полиномов типа Арзамаса тем, что гораздо лучше экстраполируется на весь пул запросов. Это по оценкам Яндекса, конечно, другие внятные оценки не известны, субъективные не катят. :)

Вот в достоверности этой оценки и есть основная засада. На мой взгляд, по НЧ Яндекс существенно проигрывает Гуглу.

G00DMAN:
Что за переход? Пэйджранк до сих пор является одним из важных факторов ранжирования в Яндексе, хотя и не самым топовым.

Browserank - существенное развитие примитивной модели Pagerank'а, ибо клики и время сессии существенно лучше коррелируют с важностью документа, чем ссылки. Этот поведенческий тренд меня радует.

G00DMAN:
По количеству уникальных запросов - больше, по доле этих НЧ в логах - меньше.

В логах получателей трафика? Имхо, тоже больше. Это, разумеется, зависит от кучи разных вещей. Я когда-то считал ctr в выдаче Яндекса в зависимости от длины запроса. До 4-5 слов - ctr растет, дальше - резко падает. Возможно, это связано с низкой релевантностью на длинных запросах.

Надо в тему Андрея Иванова позвать, у него много данных, в т.ч. по некоммерческим запросам :)

Михаил Сливинский, руководитель службы по работе с вебмастерами, Яндекс
G00DMAN
На сайте с 19.04.2008
Offline
122
#23
mikes:
Вот в достоверности этой оценки и есть основная засада. На мой взгляд, по НЧ Яндекс существенно проигрывает Гуглу.

Это все субъективно. Нужно разрабатывать нормальную метрику качества, особенно для коммерческих ВК/ВЧ. Если есть идеи - нужно обсуждать.

И при чем тут Гугл? Я же написал - лучше Арзамаса, причем скорее всего существенно лучше по внутренним метрикам Яндекса.

mikes:
Browserank - существенное развитие примитивной модели Pagerank'а, ибо клики и время сессии существенно лучше коррелируют с важностью документа, чем ссылки. Этот поведенческий тренд меня радует.

Ну хз, на сколько оно развитие. Вот Яндекс не юзает. Остальные - не известно, скорее всего аналогично. :)

mikes:
В логах получателей трафика? Имхо, тоже больше.

В логах Яндекса.

mikes
На сайте с 20.02.2006
Offline
106
#24
G00DMAN:
Ну хз, на сколько оно развитие. Вот Яндекс не юзает. Остальные - не известно, скорее всего аналогично. :)

А откуда известно, что не использует? Я что-то пропустил? ;)

Уверен, что ведущие поисковые системы используют Browserank/Clickrank. Да, в Яндексе сильны кликовые факторы в выдаче, но это не означает, что не используется другая информация о поведении пользователей.

[Удален]
#25
mikes:
ибо клики и время сессии существенно лучше коррелируют с важностью документа, чем ссылки.

наличие любого медиа контента на странице значительно увеличивает длину сессии, но это абсолютно не связано с важностью документа

то же и по кликам - хороший сниппет и кликабельность резко увеличится

так же и на документе, запутай пользователя (увеличь путь до цели) и документ важный :)

mikes
На сайте с 20.02.2006
Offline
106
#26
burunduk:
наличие любого медиа контента на странице значительно увеличивает длину сессии, но это абсолютно не связано с важностью документа

Имхо, обмануть пользователя довольно сложно. И потом, bounce rate поможет расставить точки над i :)

burunduk:
то же и по кликам - хороший сниппет и кликабельность резко увеличится
так же и на документе, запутай пользователя (увеличь путь до цели) и документ важный :)

Поскольку кликабельность по сниппетам является не только функцией релевантности документа запросу, но и функцией кучи других величин (в том числе качества сниппетовщика) - стоило бы уменьшить влияние кликовых факторов в выдаче.

А запутать пользователя невозможно :) Он просто уйдет, благо в интернете это легко сделать в один клик. Разгадывать чужие ребусы за свое время он не станет ;)

G00DMAN
На сайте с 19.04.2008
Offline
122
#27
mikes:
А откуда известно, что не использует? Я что-то пропустил? ;)

Не, это я забыл. В башке все эти факторы не укладываются. :D

Сейчас специально посмотрел - использует. Как и кучу других клик и хост ранков. За многие из которых я бы боллзы кой-кому открутил. :)

mikes:
Уверен, что ведущие поисковые системы используют Browserank/Clickrank. Да, в Яндексе сильны кликовые факторы в выдаче, но это не означает, что не используется другая информация о поведении пользователей.

Это означает немного другое - правильная накрутка кликов рвет любой топ, как Тузик футболку с лого Яндекса. :D

mr_krabs
На сайте с 31.03.2010
Offline
77
#28
mikes:
И потом, bounce rate поможет расставить точки над i :)

каким образом? тогда нужен нехилый классификатор тематик, в рамках которого один и тот же процент отказов для сайта одной тематики будет оптимальным, а для другого из рук вон плохим. гс в расчет естественно не беру. или он уже есть? )

Профессиональные услуги веб-аналитики (http://forup.ru) Форум о веб-аналитике (http://allmetrics.ru)
mikes
На сайте с 20.02.2006
Offline
106
#29
G00DMAN:
Сейчас специально посмотрел - использует. Как и кучу других клик и хост ранков. За многие из которых я бы боллзы кой-кому открутил. :)

😂😂😂

mikes добавил 11.10.2011 в 17:17

mr_krabs:
каким образом? тогда нужен нехилый классификатор тематик, в рамках которого один и тот же процент отказов для сайта одной тематики будет оптимальным, а для другого из рук вон плохим. гс в расчет естественно не беру. или он уже есть? )

Вы всерьез считаете, что поиск может обходиться без классификаторов?

Это нереально :) Для решения кучи задач информационного поиска нужна кластеризация. Конечно, поиск умеет отличать мух от котлет ;)

[Удален]
#30
mikes:
А запутать пользователя невозможно

ага, вспомним смс по подтверждению возраста ;)

1 2345 6

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий