Яндекс на RCDL 2010. Поведенческие факторы и разнообразие выдачи.

Y
На сайте с 14.10.2008
Offline
27
#81

Может конечно уже не актуально, но про кликабельность из выдачи уже задавался вопрос: http://clubs.ya.ru/search/replies.xml?parent_id=1628&with_parent=1&item_no=1616#reply-search-1628

john2007
На сайте с 26.03.2007
Offline
173
#82
VHS:
Я про абсолютные ошибки, и про искажение русского языка, которыми изобилует немало сайтов различных некоммерческих тематик. При прочих равных сайты со словом "истчо" будут релевантее чем "еще"?

Я думаю, что на большом количестве сайтов:

1) Есть корреляция, чем больше сайт, тем больше на нем орфографических ошибок.

2) А еще я думаю, что в Яндексе (оценке его ассессоров) есть корреляция, чем больше сайт, тем документы с него релевантнее, при прочих равных условиях.

Если 1 и 2 верно, то на большом количестве сайтов будет корреляция - чем больше количество орфографических ошибок, на сайте, тем документы с него релевантнее (при прочих равных условиях).

Такая корреляция называется ложной

Но при этом фактор с ложной корреляцией при внесении его в матрикснет (да и вообще в любую модель) может улучшать среднее качество выдачи.

Но естественно, в выдаче в некоторых случаях станут появляться плохие сайты с большим количеством орфографических ошибок, что в некоторый случаях ухудшит качество выдачи.

Таким образом, прочих равных, сайты со словом "истчо" могут запросто оказать релевантее чем со словом "еще", при условии того, что в модели ранжирования используется фактор абсолютного количества орфографических ошибок.

А если в модели ранжирования используется фактор относительного количества орфографических ошибок, то сайты со словом "истчо" не будут релевантее чем со словом "еще", при прочих равных условиях.

Совершая ошибки, мы не только учимся их не повторять, но и учимся прощать такие же ошибки другим... (с)
богоносец
На сайте с 30.01.2007
Offline
763
#83
люди не кликая ко мне на сайт набирают номер прям из серпа. Что будет с моим сайтом, не опракинется ли он из за низкой кликабельности по отношению к соседям

Пугающиеся этого... забывают, что из-за звонков вам прям с серпа соседям может достаться меньше кликов. Так что (в случае с заказом такси) это cоседи должны бы испугаться.

в общем первым вопросом от представителя А. и Партнеры "А вам не кажется, что сайты с более низкой ценой будут в итоге ранжироваться выше даже не прибегая к SEO оптимизации так как при большем числе переходов даже с 50 страницы такой сайт поднимется в ТОП?"

На что яндексоиды были несколько конфужены так как вопрос конечно обо всем и не о чем сразу
и ответ был примерно: "Нет вы знаете все равно хорошо оптимизированные сайты будут продвигаться лучше и вывод цены в снимпете это все только для красоты" >>>
john2007
На сайте с 26.03.2007
Offline
173
#84

Fresher, yusia, полностью подтверждает мою точку зрения, что значения поведенческих характеристик в выдаче сайтов прямо не влияет на их позиции. Спасибо за примеры! :)

богоносец
На сайте с 30.01.2007
Offline
763
#85
значения поведенческих характеристик в выдаче сайтов прямо не влияет на их позиции

Что же такое «прямо»?

«Зная цепочки запросов других пользователей, можно дополнить выдачу наиболее вероятными ответами. Например, документы, на которые никто никогда не кликал, при достаточной частоте самого запроса можно исключить, а вместо них выдавать документы, которые по цепочке запросов можно назвать хорошими», - говорит Игорь.

Для большей наглядности докладчик предложил рассмотреть «страшный объект», который называется графом запросов, где узел – это запрос, ребро – количество пользователей, переформировавших один запрос в другой, поиск – это случайное блуждание по данному графу. При этом выдача формируется на основе наиболее вероятных точек остановки поиска. Т.е. рассматриваются все варианты поведения пользователя, для того чтобы найти точки, где предыдущие пользователи вероятней всего нашли ответы. Дальше последовали не менее «страшные» формулы расчетов.

Результатами исследования стали большая привлекательность (не релевантность, а вероятность клика) выдачи и большее разнообразие выдачи. Однако есть проблемы, которые не дают в полной мере заявить о гениальности идеи. Например, поиск становится менее понятным: в SERP могут появляться URLs, в сниппетах которых нет слов запроса. >>>
john2007
На сайте с 26.03.2007
Offline
173
#86
богоносец:
Что же такое «прямо»?

Прямо в данном случае антоним слова опосредованно.

Т.е. опосредованно через формулу ранжирования для целых групп сайтов одновременно, поведенческие в топе влияют.

VHS
На сайте с 28.09.2007
Offline
142
VHS
#87

john2007, спасибо за разъяснения, однако мне кажется, что данная теория (ошибки) притянута "за уши" - ведь довольно много факторов псевдоестественности возможно придумать и внедрить в систему - зависимости подтвержденной цифрами вроде бы нет, да и явной так же не прослеживается.

john2007
На сайте с 26.03.2007
Offline
173
#88
VHS:
john2007, спасибо за разъяснения, однако мне кажется, что данная теория (ошибки) притянута "за уши" - ведь довольно много факторов псевдоестественности возможно придумать и внедрить в систему - зависимости подтвержденной цифрами вроде бы нет, да и явной так же не прослеживается.

Если Вы понимаете, что такое ложная корреляция, то должны понимать, что факторы с ложной корреляцией вполне могут улучшать среднее качество выдачи на большом числе сайтов.

Только, по-моему мнению, это не повод включать факторы с ложной корреляцией в ранжирование. На эту тему и был мой пример про ошибки, в дискуссии, к которой Вы присоединились :)

[Удален]
#89

john2007, влияют - не влияют,а эффектор вон даже по запросу проверяет влияние поведенческих:)

Полагаю и что за запрос, догадаться можно

VHS
На сайте с 28.09.2007
Offline
142
VHS
#90

john2007, я лишь предполагаю, что псевдометрик может быть бесчисленное множество, включать же в алгоритм ту или иную метрику следует лишь после математически доказанного влияния метрики на ранжирование. В исследовании YMW как раз проводится доказательство данной зависимости применительно к тестовой выборке.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий