Официальные поведенческие факторы Яндекса - обсудим?

YaanGle
На сайте с 06.09.2011
Offline
155
#411
Shlackbaum:
Почемуй-та он там же должен быть?)
Я рисунки сделал соответственно вашим рекомендациям, т.к. у меня целые числа вообще не получаются:)



Не согласен...
В этом ключе это все не может быть использовано, т.к. вмешиваются асессорские данные, которые формулируют эталонные характеристики поведенческих. И таким образом успех достигается приближением к эталонной модели, а не наращиванием всех "хороших" характеристик в целом. Потому что хороших характеристик не бывает, они тематико и запросозависимы - что "увеличению груди" хорошо, то "заказу такси" смерть . И хорошесть в свою очередь отслеживается именно относительно эталонной модели.

А вот как правильно переранжировать топ без ручного вмешивания асессорских проверок (Когда у всех итак уже Useful) - это уже интересно.
Хотя судя по той инструкции которая у меня есть - могут вмешиваться уже и некоторые элементарные параметры типа свежести документа.

Ну там же видно, для первого случая, что я очепатался и начинать надо с урл1 :)

Насчет запросо-тематико-зависимости в курсе, раньше тоже задумывался об этом. Но Вы не зря взяли слово "Хороших" в кавычки - на мой взгляд, некоторые хорошие (легко интерпретируемые сильные факторы) скорее всего обладают свойством - "чем больше, тем лучше". К примеру, кликабельность в СЕРП.

Shlackbaum
На сайте с 18.08.2010
Offline
322
#412
YaanGle:
"чем больше, тем лучше". К примеру, кликабельность в СЕРП.

Логично... Учитывая, что вес этого фактора чуть ли не самый высокий... Даже выше BM25:)

*Это если я не натупил и не напутал, т.к. слишком бегло пока доклад прочитал.

UPD: Не напутал знач;)

Пустота. Какого черта здесь появляется чья-то реклама?
YaanGle
На сайте с 06.09.2011
Offline
155
#413
Shlackbaum:
Логично... Притом, что судя по тому что вес этого фактора чуть ли не самый высокий...

Конкретно в этом исследовании признак QueryDomCTR является самым полезным, даже лучше BM25.

Shlackbaum
На сайте с 18.08.2010
Offline
322
#414
YaanGle:
Конкретно в этом исследовании признак QueryDomCTR является самым полезным, даже лучше BM25.

Это может кстати говоря косвенно показывать о слишком большом влиянии шумов при анализе маршрутов, т.к. сам по себе QueryDomCTR по логике не может нести настолько высокий показатель. Точнее не должен.

Но т.к. если впрягаться в использование маршрутных факторов вероятность напортачить значительно выше - пока веса распределяются так. Думаю если найдут метод нивелировать шумы - то значения параметров изменятся как раз в сторону веса маршрутных.

YaanGle
На сайте с 06.09.2011
Offline
155
#415
Shlackbaum:
Это может кстати говоря косвенно показывать о слишком большом влиянии шумов при анализе маршрутов, т.к. сам по себе QueryDomCTR по логике не может нести настолько высокий показатель. Точнее не должен.
Но т.к. если впрягаться в использование маршрутных факторов вероятность напортачить значительно выше - пока веса распределяются так. Думаю если найдут метод нивелировать шумы - то значения параметров изменятся как раз в сторону веса маршрутных.

Значительная часть запросов - уникальная, соответственно там не будет признаков, связанных с CTR по запросу. А эти посткликовые признаки не связаны с запросом (агрегируются на уровне домена или урл), соответственно в исследовании и показано, что максимальная польза от них на редких запросах.

Shlackbaum
На сайте с 18.08.2010
Offline
322
#416
YaanGle:
Значительная часть запросов - уникальная, соответственно там не будет признаков, связанных с CTR по запросу.

Будут, просто они не пройдут кворум статистической значимости.

YaanGle:
А эти посткликовые признаки не связаны с запросом (агрегируются на уровне домена или урл), соответственно в исследовании и показано, что максимальная польза от них на редких запросах.

логично.

По сути зависимый компонент траста.

T
На сайте с 28.05.2010
Offline
67
#417
foxi:
я, да и много кто, при поиске открывает сразу нескольок страниц, страниц 5, все последующие клики идут во вред сайту? :D

Наверняка есть статистическая выборка на основании которой исследуется аудитория, с определенным типом поведения, со средне статистическим количеством вкладок

А пользователи которые в выборку не попадают, или которых довольно малое незначительно количество, игнорируются или считаются в общем котле.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий