Это откуда такой вывод?
Как это по-женски 😂
И не заметишь :)
Значительная часть запросов - уникальная, соответственно там не будет признаков, связанных с CTR по запросу. А эти посткликовые признаки не связаны с запросом (агрегируются на уровне домена или урл), соответственно в исследовании и показано, что максимальная польза от них на редких запросах.
Конкретно в этом исследовании признак QueryDomCTR является самым полезным, даже лучше BM25.
Ну там же видно, для первого случая, что я очепатался и начинать надо с урл1 :)
Насчет запросо-тематико-зависимости в курсе, раньше тоже задумывался об этом. Но Вы не зря взяли слово "Хороших" в кавычки - на мой взгляд, некоторые хорошие (легко интерпретируемые сильные факторы) скорее всего обладают свойством - "чем больше, тем лучше". К примеру, кликабельность в СЕРП.
1. У Вас С1 на изображении должен быть урл1- урл7, тогда будет 3.
2. Я прогнал, видимо автоматически подогнал к ответу. :)
В любом случае, корень, это урл0, а четкое определение сегмента (ветви) они не дали, есть только:
"Мы раскололи маршрут на сегменты (=ветви), каждый следующий сегмент начинается с повторного визита ранее посещенной страницы и представляет собой цепочку последовательных гиперссылочных переходов. Для каждого сегмента, получаем его длину, которая равна число ребер, образующих этот сегмент. Мы игнорируем сегменты длиной 1, так как они не образуют новые ветви деревьев. Средняя длина ветви получается как длины, усредненные по всем различным сегментам (ветвям) дерева"
Опуская мелочи, что касается практического применения - тут для меня все не очевидно. Разве что могу предположить - чем больше удовлетворенных шагов и dwell time, тем видимо лучше.
Лучше скажите, какие практические выводы Вы из этого доклада сделали - с целью улучшения seo :)
С одной стороны, если посчитать длину для 3х ветвей, как ребра между (1) урл0-урл4, (2) урл1-урл6, (3)урл7-урл9, не учитывая пунктирные линии, то среднее получится 3.
С другой стороны, по тексту есть фраза, "We ignore chains of length 1 since they do not initiate new tree branches.", т.е. они не учитывают последовательности с 1 ребром, тк они не создают новых ветвей.
Из этого, я делаю вывод (позже поясняю), что 3 ветви будут такие: (1) урл0-урл4, (2) урл4-урл6, (3) урл6-урл9, с учетом пунктирных. В этом случае, средняя длина равна 4, и , например, если бы после урл4 был только возврат на урл1, то новой ветви бы действительно не создавалось. Т.е., ошибка в описании к изображению, имхо.
Потому что, в оригинале:
1. "with the clicked results as their roots."
2. "Depth is the distance between the tree root and the most distant node, where the distance between two nodes of a tree is the number of edges in the shortest path connecting these two nodes by edges of the tree."
- теперь смотрим, как перевели на сайтклиник:
"Глубина (Depth). Это расстояние между корнем дерева (поисковым запросом) и наиболее удаленным узлом"
Отсюда делаем вывод, что про корень дерева в поисковом запросе они сами выдумали, в оригинале явно указан "кликнутый результат" , т.е. на изображении это URL0
Я далеко не специалист по английскому, но читая их перевод замечал и другие нестыковки, отписывать было лень и бестолку им (судя по аудитории в комментах).
В Яндексе для ГЗ и ГНЗ запросов используются разные формулы ранжирования, т.е. разница позиций связана не только с конкуренцией (даже скорее). Но, что касаемо конкуренции - многие связки запрос+город значительно конкретизируют намерение пользователя, т.е. конкуренция может повышаться. Плюс, запрос всё же сам по себе другой, хотя и похож.
Смотрите на топ, как всегда.