Официальные поведенческие факторы Яндекса - обсудим?

yerez
На сайте с 29.01.2007
Offline
204
#401

Яндекс обладает достаточно большим массивом данных о юзерах, которые имитировать очень сложно, фактически нужно просто стать юзером))) Полезный видос частично на эту тему: http://www.youtube.com/watch?v=OyduPQeroEU

Так что все эти накрутки, помимо того, что легко палятся и режутся, как несоответсвующие паттернам (DwellTimeDev, 10thDwellTime, 90thDwellTime, QDwellTimeDev), так еще и как-то обрабатываются через персональную историю поиска, половозрастных характеристик конкретного пользователя и т.д.

Слишком сложная задача для примитивных закупалок ссылок по параметрам, плюс ко всему это еще может и привести к санкциям, что загубит со всем плохим и то хорошее, что имеется.

Shlackbaum
На сайте с 18.08.2010
Offline
322
#402

Блин, я только попкорн взял, а тема затухла (причем 4 месяца назад).

Ну кто доклад читал объясните:

1. Почему в исследуемом случае глубина равна 4, а не пяти, если определение явно говорит о количестве отрезков между промежуточными узлами от корня дерева до последнего узла?

SE-URL0 0+1=1

URL0-URL1 1+1=2

URL1-URL7 2+1=3

URL7-URL8 3+1=4

URL8-URL9 4+1=5

Пять, а не 4. Я так понимаю почему то решили исключить самый первый узел, но почему, если определение говорит о как раз его учете?

2. Почему средняя длина ветви равна 3? Если мы посчитаем по альтернативной формуле на основании ранее полученных данных:

((кол-во узлов -1) / ширина) +1.

То у нас получится ((10-1)/3)+1=9/3+1=3+1=4. Средняя длина ветви по альтернативной формуле равняется не 3, а 4.

И вообще можно поподробнее как рассчитывается средняя длина ветви?

Из определения неясно например нужно ли считать:

а) первую ветвь, т.к. она не начинается с просмотра УЖЕ ПОСЕЩЕННОЙ страницы

б) включается ли в количество элементов ветви элементы, после которых произошел возврат на ранее посещенную страницу или в момент совершения возврата длина ветви кончается?

Пустота. Какого черта здесь появляется чья-то реклама?
YaanGle
На сайте с 06.09.2011
Offline
155
#403
Shlackbaum:
Блин, я только попкорн взял, а тема затухла (причем 4 месяца назад).

Ну кто доклад читал объясните:
1. Почему в исследуемом случае глубина равна 4, а не пяти, если определение явно говорит о количестве отрезков между промежуточными узлами от корня дерева до последнего узла?
SE-URL0 0+1=1
URL0-URL1 1+1=2
URL1-URL7 2+1=3
URL7-URL8 3+1=4
URL8-URL9 4+1=5
Пять, а не 4. Я так понимаю почему то решили исключить самый первый узел, но почему, если определение говорит о как раз его учете?
2. Почему средняя длина ветви равна 3? Если мы посчитаем по альтернативной формуле на основании ранее полученных данных:
((кол-во узлов -1) / ширина) +1.
То у нас получится ((10-1)/3)+1=9/3+1=3+1=4. Средняя длина ветви по альтернативной формуле равняется не 3, а 4.
И вообще можно поподробнее как рассчитывается средняя длина ветви?
Из определения неясно например нужно ли считать:
а) первую ветвь, т.к. она не начинается с просмотра УЖЕ ПОСЕЩЕННОЙ страницы
б) включается ли в количество элементов ветви элементы, после которых произошел возврат на ранее посещенную страницу или в момент совершения возврата длина ветви кончается?

Потому что, в оригинале:

1. "with the clicked results as their roots."

2. "Depth is the distance between the tree root and the most distant node, where the distance between two nodes of a tree is the number of edges in the shortest path connecting these two nodes by edges of the tree."

- теперь смотрим, как перевели на сайтклиник:

"Глубина (Depth). Это расстояние между корнем дерева (поисковым запросом) и наиболее удаленным узлом"

Отсюда делаем вывод, что про корень дерева в поисковом запросе они сами выдумали, в оригинале явно указан "кликнутый результат" , т.е. на изображении это URL0

Я далеко не специалист по английскому, но читая их перевод замечал и другие нестыковки, отписывать было лень и бестолку им (судя по аудитории в комментах).

Shlackbaum
На сайте с 18.08.2010
Offline
322
#404

YaanGle,

1) Я сначала тоже думал что это тупняк перевода, то что было добавлено на сайтклиник, но альтернатива: получается что при переходе на страницу без дальнейшего перехода вглубь сайта глубина равна нулю? o.O

2) Да, но цифры они у нас везде арабские. И в цифрах ошибки нет. Средняя длина ветви по альтернативной формуле (=4) не равна той, которая указана в докладе там же в легенде таблицы (=3)

YaanGle
На сайте с 06.09.2011
Offline
155
#405
Shlackbaum:
YaanGle,
1) Я сначала тоже думал что это тупняк перевода, то что было добавлено на сайтклиник, но альтернатива: получается что при переходе на страницу без дальнейшего перехода вглубь сайта глубина равна нулю? o.O
2) Да, но цифры они у нас везде арабские. И в цифрах ошибки нет. Средняя длина ветви по альтернативной формуле (=4) не равна той, которая указана в докладе там же в легенде таблицы (=3)

С одной стороны, если посчитать длину для 3х ветвей, как ребра между (1) урл0-урл4, (2) урл1-урл6, (3)урл7-урл9, не учитывая пунктирные линии, то среднее получится 3.

С другой стороны, по тексту есть фраза, "We ignore chains of length 1 since they do not initiate new tree branches.", т.е. они не учитывают последовательности с 1 ребром, тк они не создают новых ветвей.

Из этого, я делаю вывод (позже поясняю), что 3 ветви будут такие: (1) урл0-урл4, (2) урл4-урл6, (3) урл6-урл9, с учетом пунктирных. В этом случае, средняя длина равна 4, и , например, если бы после урл4 был только возврат на урл1, то новой ветви бы действительно не создавалось. Т.е., ошибка в описании к изображению, имхо.

Shlackbaum
На сайте с 18.08.2010
Offline
322
#406
YaanGle:
Т.е., ошибка в описании к изображению, имхо.

Вот после такого я и думаю... где у них там еще ошибки в описании... к алгоритму...

---------- Добавлено 25.04.2014 в 14:27 ----------

Да ппц. Как вы считаете-то?

YaanGle:
С одной стороны, если посчитать длину для 3х ветвей, как ребра между (1) урл0-урл4, (2) урл1-урл6, (3)урл7-урл9, не учитывая пунктирные линии, то среднее получится 3.

YaanGle:
3 ветви будут такие: (1) урл0-урл4, (2) урл4-урл6, (3) урл6-урл9, с учетом пунктирных. В этом случае, средняя длина равна 4, и , например, если бы после урл4 был только возврат на урл1, то новой ветви бы действительно не создавалось. Т.е., ошибка в описании к изображению, имхо.

YaanGle
На сайте с 06.09.2011
Offline
155
#407
Shlackbaum:
Вот после такого я и думаю... где у них там еще ошибки в описании... к алгоритму...

---------- Добавлено 25.04.2014 в 14:27 ----------

Да ппц. Как вы считаете-то?




Лучше скажите, какие практические выводы Вы из этого доклада сделали - с целью улучшения seo :)

Shlackbaum
На сайте с 18.08.2010
Offline
322
#408
YaanGle:
Лучше скажите, какие практические выводы Вы из этого доклада сделали - с целью улучшения seo :)

На данный момент практический вывод только один - если они гонят в докладах (ошибаются или как там еще) - то в алгоритме у них вообще полный мусор...

Ибо я даже до конца доклад прочитать не могу, т.к. не сходится ни хрена все еще на моменте выдачи определений

YaanGle
На сайте с 06.09.2011
Offline
155
#409
Shlackbaum:
Вот после такого я и думаю... где у них там еще ошибки в описании... к алгоритму...

---------- Добавлено 25.04.2014 в 14:27 ----------

Да ппц. Как вы считаете-то?

1. У Вас С1 на изображении должен быть урл1- урл7, тогда будет 3.

2. Я прогнал, видимо автоматически подогнал к ответу. :)

В любом случае, корень, это урл0, а четкое определение сегмента (ветви) они не дали, есть только:

"Мы раскололи маршрут на сегменты (=ветви), каждый следующий сегмент начинается с повторного визита ранее посещенной страницы и представляет собой цепочку последовательных гиперссылочных переходов. Для каждого сегмента, получаем его длину, которая равна число ребер, образующих этот сегмент. Мы игнорируем сегменты длиной 1, так как они не образуют новые ветви деревьев. Средняя длина ветви получается как длины, усредненные по всем различным сегментам (ветвям) дерева"

Опуская мелочи, что касается практического применения - тут для меня все не очевидно. Разве что могу предположить - чем больше удовлетворенных шагов и dwell time, тем видимо лучше.

Shlackbaum
На сайте с 18.08.2010
Offline
322
#410
YaanGle:
1. У Вас С1 на изображении должен быть урл1- урл7, тогда будет 3.

Почемуй-та он там же должен быть?)

Я рисунки сделал соответственно вашим рекомендациям, т.к. у меня целые числа вообще не получаются:)

Опуская мелочи, что касается практического применения - тут для меня все не очевидно. Разве что могу предположить - чем больше удовлетворенных шагов и dwell time, тем видимо лучше.

Не согласен...

В этом ключе это все не может быть использовано, т.к. вмешиваются асессорские данные, которые формулируют эталонные характеристики поведенческих. И таким образом успех достигается приближением к эталонной модели, а не наращиванием всех "хороших" характеристик в целом. Потому что хороших характеристик не бывает, они тематико и запросозависимы - что "увеличению груди" хорошо, то "заказу такси" смерть . И хорошесть в свою очередь отслеживается именно относительно эталонной модели.

А вот как правильно переранжировать топ без ручного вмешивания асессорских проверок (Когда у всех итак уже Useful) - это уже интересно.

Хотя судя по той инструкции которая у меня есть - могут вмешиваться уже и некоторые элементарные параметры типа свежести документа.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий