YaanGle

YaanGle
Рейтинг
155
Регистрация
06.09.2011
yanus:
С другой стороны - эти преимущества меняются довольно часто, соответственно и сниппет придется обновлять довольно часто. А это может негативно сказаться на текстовом ранжировании.

Это откуда такой вывод?

Cat_Out:
Это личное )) Я пока не готова.

Как это по-женски 😂

штота я ранее и не замечал такого влияния метрики на индексацию. Твиттер - да, до сих пор в течение 15-30 минут в индекс загоняет (не основной), а вот метрика.... изучимс

И не заметишь :)

Shlackbaum:
Это может кстати говоря косвенно показывать о слишком большом влиянии шумов при анализе маршрутов, т.к. сам по себе QueryDomCTR по логике не может нести настолько высокий показатель. Точнее не должен.
Но т.к. если впрягаться в использование маршрутных факторов вероятность напортачить значительно выше - пока веса распределяются так. Думаю если найдут метод нивелировать шумы - то значения параметров изменятся как раз в сторону веса маршрутных.

Значительная часть запросов - уникальная, соответственно там не будет признаков, связанных с CTR по запросу. А эти посткликовые признаки не связаны с запросом (агрегируются на уровне домена или урл), соответственно в исследовании и показано, что максимальная польза от них на редких запросах.

Shlackbaum:
Логично... Притом, что судя по тому что вес этого фактора чуть ли не самый высокий...

Конкретно в этом исследовании признак QueryDomCTR является самым полезным, даже лучше BM25.

Shlackbaum:
Почемуй-та он там же должен быть?)
Я рисунки сделал соответственно вашим рекомендациям, т.к. у меня целые числа вообще не получаются:)



Не согласен...
В этом ключе это все не может быть использовано, т.к. вмешиваются асессорские данные, которые формулируют эталонные характеристики поведенческих. И таким образом успех достигается приближением к эталонной модели, а не наращиванием всех "хороших" характеристик в целом. Потому что хороших характеристик не бывает, они тематико и запросозависимы - что "увеличению груди" хорошо, то "заказу такси" смерть . И хорошесть в свою очередь отслеживается именно относительно эталонной модели.

А вот как правильно переранжировать топ без ручного вмешивания асессорских проверок (Когда у всех итак уже Useful) - это уже интересно.
Хотя судя по той инструкции которая у меня есть - могут вмешиваться уже и некоторые элементарные параметры типа свежести документа.

Ну там же видно, для первого случая, что я очепатался и начинать надо с урл1 :)

Насчет запросо-тематико-зависимости в курсе, раньше тоже задумывался об этом. Но Вы не зря взяли слово "Хороших" в кавычки - на мой взгляд, некоторые хорошие (легко интерпретируемые сильные факторы) скорее всего обладают свойством - "чем больше, тем лучше". К примеру, кликабельность в СЕРП.

Shlackbaum:
Вот после такого я и думаю... где у них там еще ошибки в описании... к алгоритму...

---------- Добавлено 25.04.2014 в 14:27 ----------

Да ппц. Как вы считаете-то?

1. У Вас С1 на изображении должен быть урл1- урл7, тогда будет 3.

2. Я прогнал, видимо автоматически подогнал к ответу. :)

В любом случае, корень, это урл0, а четкое определение сегмента (ветви) они не дали, есть только:

"Мы раскололи маршрут на сегменты (=ветви), каждый следующий сегмент начинается с повторного визита ранее посещенной страницы и представляет собой цепочку последовательных гиперссылочных переходов. Для каждого сегмента, получаем его длину, которая равна число ребер, образующих этот сегмент. Мы игнорируем сегменты длиной 1, так как они не образуют новые ветви деревьев. Средняя длина ветви получается как длины, усредненные по всем различным сегментам (ветвям) дерева"

Опуская мелочи, что касается практического применения - тут для меня все не очевидно. Разве что могу предположить - чем больше удовлетворенных шагов и dwell time, тем видимо лучше.

Shlackbaum:
Вот после такого я и думаю... где у них там еще ошибки в описании... к алгоритму...

---------- Добавлено 25.04.2014 в 14:27 ----------

Да ппц. Как вы считаете-то?




Лучше скажите, какие практические выводы Вы из этого доклада сделали - с целью улучшения seo :)

Shlackbaum:
YaanGle,
1) Я сначала тоже думал что это тупняк перевода, то что было добавлено на сайтклиник, но альтернатива: получается что при переходе на страницу без дальнейшего перехода вглубь сайта глубина равна нулю? o.O
2) Да, но цифры они у нас везде арабские. И в цифрах ошибки нет. Средняя длина ветви по альтернативной формуле (=4) не равна той, которая указана в докладе там же в легенде таблицы (=3)

С одной стороны, если посчитать длину для 3х ветвей, как ребра между (1) урл0-урл4, (2) урл1-урл6, (3)урл7-урл9, не учитывая пунктирные линии, то среднее получится 3.

С другой стороны, по тексту есть фраза, "We ignore chains of length 1 since they do not initiate new tree branches.", т.е. они не учитывают последовательности с 1 ребром, тк они не создают новых ветвей.

Из этого, я делаю вывод (позже поясняю), что 3 ветви будут такие: (1) урл0-урл4, (2) урл4-урл6, (3) урл6-урл9, с учетом пунктирных. В этом случае, средняя длина равна 4, и , например, если бы после урл4 был только возврат на урл1, то новой ветви бы действительно не создавалось. Т.е., ошибка в описании к изображению, имхо.

Shlackbaum:
Блин, я только попкорн взял, а тема затухла (причем 4 месяца назад).

Ну кто доклад читал объясните:
1. Почему в исследуемом случае глубина равна 4, а не пяти, если определение явно говорит о количестве отрезков между промежуточными узлами от корня дерева до последнего узла?
SE-URL0 0+1=1
URL0-URL1 1+1=2
URL1-URL7 2+1=3
URL7-URL8 3+1=4
URL8-URL9 4+1=5
Пять, а не 4. Я так понимаю почему то решили исключить самый первый узел, но почему, если определение говорит о как раз его учете?
2. Почему средняя длина ветви равна 3? Если мы посчитаем по альтернативной формуле на основании ранее полученных данных:
((кол-во узлов -1) / ширина) +1.
То у нас получится ((10-1)/3)+1=9/3+1=3+1=4. Средняя длина ветви по альтернативной формуле равняется не 3, а 4.
И вообще можно поподробнее как рассчитывается средняя длина ветви?
Из определения неясно например нужно ли считать:
а) первую ветвь, т.к. она не начинается с просмотра УЖЕ ПОСЕЩЕННОЙ страницы
б) включается ли в количество элементов ветви элементы, после которых произошел возврат на ранее посещенную страницу или в момент совершения возврата длина ветви кончается?

Потому что, в оригинале:

1. "with the clicked results as their roots."

2. "Depth is the distance between the tree root and the most distant node, where the distance between two nodes of a tree is the number of edges in the shortest path connecting these two nodes by edges of the tree."

- теперь смотрим, как перевели на сайтклиник:

"Глубина (Depth). Это расстояние между корнем дерева (поисковым запросом) и наиболее удаленным узлом"

Отсюда делаем вывод, что про корень дерева в поисковом запросе они сами выдумали, в оригинале явно указан "кликнутый результат" , т.е. на изображении это URL0

Я далеко не специалист по английскому, но читая их перевод замечал и другие нестыковки, отписывать было лень и бестолку им (судя по аудитории в комментах).

lelia:
Сайт по запросам, например, "купить квартиру" в топ 10 , а " купить квартиру в Москве" в третьей десятке. Получается конкуренция по запросу с географией выше? На что в первую очередь обратить внимание, чтобы поднять запрос с географической привязкой?

В Яндексе для ГЗ и ГНЗ запросов используются разные формулы ранжирования, т.е. разница позиций связана не только с конкуренцией (даже скорее). Но, что касаемо конкуренции - многие связки запрос+город значительно конкретизируют намерение пользователя, т.е. конкуренция может повышаться. Плюс, запрос всё же сам по себе другой, хотя и похож.

Смотрите на топ, как всегда.

Всего: 1049