Поведенческие факторы. Быстрее, выше, сильнее?

di_max
На сайте с 27.12.2006
Offline
262
#161
юни:
Пора Гудмана звать, опять. :)

... пусть он посчитает самый популяный полином...

// Все наши проблемы от нашего не знания...
Shlackbaum
На сайте с 18.08.2010
Offline
322
#162
Smart____:
Какой полином? Вы о чем? Тут бы разобраться с перспективой линейного приближения! А уж если линейная модель что-то предсказывает, тогда можно и перейти к квадратичным членам - правда это уже будет изврат в ^2 и т.д. изват^3...
Дальше линейного приближения в потребительских моделях двигаться нельзя - вредно для здоровья (здравого смысла).

Я не заявлял того, что полином из этих характеристик используется поисковыми системами. Также как не заявлял и обратного;)

Я заявил лишь, что есть мнение, что такой полином может быть использован для анализа качества страницы для конкретного запроса.

Smart____:
И вы всерьёз считаете "время сессии, глубина просмотра, отказы " - эти показатели независимыми? Что бы из них лепить непонятно зачем полином? :)

Показатели зависимы... но далеко не прямо, а по сложным формулам, причем кое где некоторые коэффициенты могут быть равны нулю. (например как не использование некоторых переменных в формуле ранжирования для разных сайтов в зависимости от характеристик этих сайтов, типа тематики, региона или коммерческой/информационной доминирующей направленности и других...)

Но это не исключает факт полезности определенного полинома из этих характеристик. Полином ведь по разному "слепить" можно;)

Пустота. Какого черта здесь появляется чья-то реклама?
[Удален]
#163
Shlackbaum:
Ээ??

Поведенческий фактор является релевантным, потому как должна быть некоторая точка отсчёта. Ведь может быть несколько видов поведения пользователя: хаотичное накликивание на сайте, или просто сёрфинг с чтением каждой страницы, или заход/уход, а ещё лучше - заказ.

Shlackbaum:
ЭЭээээ???

Имею в виду вертикальный поиск в Яндексе, где все данные распределены по тематикам. Ведь сайты разных групп ПС относит к разным кластерам информации, верно?

Shlackbaum:
Что за...?! Отдай траву, щас же!

Курю форумный бамбук лучших сортов :), пытаюсь понять что-то сам на основе полученных в институте и на уроках математики знаний. :)

Кстати говоря, сейчас ведь Яндекс вводит персептивную модель поиска. Т.е. как фактор ранжирование некое постоянство в поведении пользователей. Социальный фактор что ли :o

И вообще - это функция от многих переменных. Каким-то образом она учитывается. Как провести эксперимент. Вот в чём вопрос.

Shlackbaum
На сайте с 18.08.2010
Offline
322
#164
search-eng:
Поведенческий фактор является релевантным, потому как должна быть некоторая точка отсчёта. Ведь может быть несколько видов поведения пользователя: хаотичное накликивание на сайте, или просто сёрфинг с чтением каждой страницы, или заход/уход, а ещё лучше - заказ.

Да причем тут релевантным-то? Определение релевантности я Вам уже дал. Здесь оно вообще не применимо. Определитесь с понятиями.

search-eng:
Имею в виду вертикальный поиск в Яндексе, где все данные распределены по тематикам.

Не понял как это относится к предыдущему Вашему высказыванию:

Таким образом, например релевантный сайт «Борисхоф», это тот сайт, на который пришли по рекламному объявлению из «Газета» или другого сайта. При этом поток дальше должен или делать заказ или уходить с сайта на привычный сайт, т.е. туда, куда обычно заходил пользователь. В дальнейшем, если человек не сделал заказ в один день, то, релевантным с точки зрения Яндекс, при заинтересованности человека в покупке авто будет регистрация на форуме. В таком случае ПФ пользователя по-отношению к двум сайтам и к Яндекс будет адекватным шагом к покупке.
search-eng:
Ведь сайты разных групп ПС относит к разным кластерам информации, верно?

Нет, неверно. У сайта может быть доминирующая тематика и Яндекс несомненно пытается распределить сайты по тематическим категориям (ЯК). Однако это не значит, что сайт относится только к этой категории. Если хотите разобраться более подробно:

Проблема любой классификации состоит в том, что чем она подробнее (то есть чем лучше она отражает многообразие классифицируемого материала), тем труднее в ней разобраться пользователю. Так как она превращается в древо с таким множеством ветвей, что угадать, на какую из них составитель повесил нужный пользователю «листик», практически невозможно. Ведь с увеличением числа рубрик в Каталоге возрастает и число пограничных ситуаций, когда «листик», вроде можно отнести и на одну ветку, и на другую, а в каком-то отношении и на третью.

Также можете попробовать разобраться в понятии "Тематического Спектра" из Мадридского доклада Яндекса

search-eng:
Кстати говоря, сейчас ведь Яндекс вводит персептивную модель поиска. Т.е. как фактор ранжирование некое постоянство в поведении пользователей. Социальный фактор что ли :o



И вообще - это функция от многих переменных. Каким-то образом она учитывается. Как провести эксперимент. Вот в чём вопрос.

Не могу прокомментировать.

Smart____
На сайте с 25.12.2009
Offline
76
#165
search-eng:
Поведенческий фактор является релевантным, потому как должна быть некоторая точка отсчёта. Ведь может быть несколько видов поведения пользователя: хаотичное накликивание на сайте, или просто сёрфинг с чтением каждой страницы, или заход/уход, а ещё лучше - заказ.

Какой такой фактор-то? Да еще и релевантный? И с точкой отчета и т.д. и т.д. :)

Так много текста в теме, предмет обсуждения ни кем не обозначен!😕

Нашел на http://seopult.ru/subscribe.html?id=22 внятно прописанные показатели ответственные за основные ПФ:

1. Показатель отказов (bounce rate)

2. Время, проведенное на сайте

3. Количество просмотренных страниц (глубина просмотра)

4. Первый и последний клики по выдаче -ПС считает более релевантными сайтами

п.1-4: собственно и есть предмет для обсуждения. И никакой полином из этих показателей не нужен, если они не отвечают на вопрос: Изменение показателя в ту или иную сторону есть хорошо/плохо для сайта?

п1. Изменение в + или - %отказов в общем случае ровным счетом ничего нам не говорит. Более того в абсолютном выражении Отказы для ~80% поисковых запросов в идеале д.б. =100%

п2 и п3: "Время посещения" и "глубина просмотра" по сути один и тот же показатель: время посещения = время 1-го просмотра * Глубину просмотров. Так что достаточно и одного показателя "Время посещения". С этим показателем "качества сайта" тоже абсолютно все понятно. Для ~80% поисковых переходов это время должно быть как можно меньше. Для абсолютного большинства сайтов поисковые посещения составляют не более 2-3 мин.

Совершенно очевидно, что абсолютные значения показателей: "Отказы" и "Время" и их производные - в общем случае ничего нам не расскажут о качестве сайта.

P.S. п.4 оставлю без комментария.

возьмем n, нет мало возьмем m
Shlackbaum
На сайте с 18.08.2010
Offline
322
#166
4. Первый и последний клики по выдаче -ПС считает более релевантными сайтами.
п.4 оставлю без комментария.

А я не оставлю:) Был такой пунктик на РОМИП-2010:

5.2. Graded Mean Reciprocal Rank и Pfound
Данные метрики оценивают удовлетворенность пользователя результатами поиска на основе следующей модели:
- Пользователь просматривает результаты запроса, начиная с первого документа.
- После каждого просмотра документа пользователь принимает случайное решение:
- либо завершить поиск и остаться удовлетворенным — вероятность такого исхода зависит от оценки релевантности документа;
- прервать поиск, оставшись неудовлетворенным (с фиксированной вероятностью);
- продолжить просмотр списка документов.
- Результирующая оценка ответа системы – вероятность того, что пользователь завершит поиск, оставшись удовлетворенным.
Согласно данной модели, степень влияния оценки релевантности документа на метрику зависит не только от позиции документа, но и от оценки релевантности документов, находящихся выше в списке результатов. Например, если для запроса A выдано 9 релевантных документов подряд, то релевантность 10-го документа слабо влияет на оценку запроса (скорее всего пользователь удовлетворится вышестоящими документами). В то же время, если для запроса B выдано 9 нерелевантных документов подряд, то релевантность 10-го документа сильно влияет на оценку запроса.
п.1-4: собственно и есть предмет для обсуждения. И никакой полином из этих показателей не нужен, если они не отвечают на вопрос: Изменение показателя в ту или иную сторону есть хорошо/плохо для сайта?

Вообще - то как раз в этом случае полином и нужен, т.к.системно больше не на чем основываться для получения искомой информации:) Про эмерджентность систем знаете?

Совершенно очевидно, что абсолютные значения показателей: "Отказы" и "Время" и их производные - в общем случае ничего нам не расскажут о качестве сайта.

Вот ыменно, вот ыменно!

п2 и п3: "Время посещения" и "глубина просмотра" по сути один и тот же показатель:

Да что Вы, в самом деле??

Smart____
На сайте с 25.12.2009
Offline
76
#167
Shlackbaum:

Да что Вы, в самом деле??

Еще раз повторяю.

"Глубина просмотра" - это безразмерный показатель.

"Время посещения (сессии)" - имеет размерность времени.

Они связаны с друг с другом через размерный коэффициент пропорциональности - "среднее время 1-го просмотра"[в мин]:

Среднее время посещения = "среднее время 1-го просмотра" * Средняя глубина просмотров

и кончим с этим очевидным и простым :)

Shlackbaum:

А я не оставлю Был такой пунктик на РОМИП-2010:

Этот показатель я оставил без коммента, поскольку мы его измерить не можем, он на "их" стороне. Коль измерения не возможны, все слова сотрясание воздуха, как в моей подписи :)

Shlackbaum
На сайте с 18.08.2010
Offline
322
#168
Smart____:
Еще раз повторяю.
"Глубина просмотра" - это безразмерный показатель.
"Время посещения (сессии)" - имеет размерность времени.
Они связаны с друг с другом через размерный коэффициент пропорциональности - "среднее время 1-го просмотра"[в мин]:

Среднее время посещения = "среднее время 1-го просмотра" * Средняя глубина просмотров

и кончим с этим очевидным и простым :)

Вы видимо не поняли зачем я дал ссылку:

Я так понимаю, что здесь используется такая методология, когда пользователь заходит на сайт и более никуда не переходит, но и не был зарегистрирован как "покинувший" сайт. Другими словами, если пользователь не совершил клика (не обязательно в ссылку;)), после посещения страницы и одновременно не закрыл страницу до окончания 15-секундного интервала, то он считается "проведшим" на сайте ровно 15 секунд. Даже если он провел на ней 3 часа непрерывного просмотра, но постоянно крутил колесо мышки туда-сюда.

Или вы совсем среднюю по больнице предлагаете считать?? Вы знаете какой объем поискового трафика регистрируется на точках входа, на которых не было совершено кликов, но которые не были посчитаны как отказы? Я нет. Надо у Яндекса спросить, тогда можно будет игнорировать эту часть трафика не боясь за чистоту рассуждений. А пока Яндекс молчит...

Smart____:
Этот показатель я оставил без коммента, поскольку мы его измерить не можем, он на "их" стороне. Коль измерения не возможны, все слова сотрясание воздуха, как в моей подписи :)

Мы измерить не можем. А у системы вполне вероятно есть такой инструмент измерения на основе вот этого набора непонятных букв: Graded Mean Reciprocal Rank и Pfound (вспомним что это 2010 год был)

Smart____
На сайте с 25.12.2009
Offline
76
#169
Shlackbaum:
Вообще - то как раз в этом случае полином и нужен, т.к.системно больше не на чем основываться для получения искомой информации Про эмерджентность систем знаете?

слова слова слова... :)

Shlackbaum
На сайте с 18.08.2010
Offline
322
#170
Smart____:
слова слова слова... :)

А за рекламу мне по шее дадут;) Всему свое время

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий