Про разделители («.» «?» «!» «,») в анкоре ссылки.

К
На сайте с 03.02.2005
Offline
74
#221
euhenio:
Я думаю, что пересекающихся пассажей не бывает

Т.е. документы-предложения [aa bb cc dd] и [aa aa bb cc dd] будут иметь одинаковый вес по отношению к запросу [aa bb]?

euhenio
На сайте с 21.09.2001
Offline
357
#222
Кот:
Да, в каждом. Но только после того, как отработал механизм кворума. И я об этом писал:

-а после того, как "отработал механизм кворума", у каждого пассажа возник свой вес, зависящий в т.ч. и от расстояний между словами. И как предполагается выцепить из этого веса ту долю, которую туда вложило конкретное слово?

Отнять и поделить? :)

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
euhenio
На сайте с 21.09.2001
Offline
357
#223
Кот:
Т.е. документы-предложения [aa bb cc dd] и [aa aa bb cc dd] будут иметь одинаковый вес по отношению к запросу [aa bb]?

-ну, я думаю, что должен выцепиться более релевантный фрагмент "aa bb", если переколдовка запроса была aa & bb

К
На сайте с 03.02.2005
Offline
74
#224
euhenio:
-а после того, как "отработал механизм кворума", у каждого пассажа возник свой вес, зависящий в т.ч. и от расстояний между словами. И как предполагается выцепить из этого веса ту долю, которую туда вложило конкретное слово?

После того, как отработал механизм кворума, никакой вес у пассажей еще не возник. Вес у пассажей возникает позже, на этапе ранжирования (в терминах статьи).

euhenio, я особо не настаиваю на описанном механизме. Но скажите, Вы считаете, что это такая большая проблема - распределить каким-либо образом вес термина по пассажам?

euhenio:
-ну, я думаю, что должен выцепиться более релевантный фрагмент "aa bb", если переколдовка запроса была aa & bb

Ну так, веса у этих документов-предложений одинаковые будут или нет?

euhenio
На сайте с 21.09.2001
Offline
357
#225
Кот:
Ну так, веса у этих документов-предложений одинаковые будут или нет

-вообще да, думаю, одинаковые. Но я бы все равно при оптимизации написал побольше слова aa - на всякий случай. :) Да и бб добавил бы. :)

Кот:
После того, как отработал механизм кворума, никакой вес у пассажей еще не возник. Вес у пассажей возникает позже, на этапе ранжирования

-Идею понял лучше. Веса считаются после прохождения кворума. Но ммм... как бы так сказать... Ну, например.

Есть 2 пассажа во фразе А Б А по запросу А & Б.

Будем предполагать (думаю, разумно), что вес двусовных пассажей пропорционален произведению веса А на вес Б. Плюс учет расстояния.

1. Wab=вес пассажа А Б=K1*Wa*Wb

2. Wba=вес пассажа Б А=K2*Wa*Wb

K2<K1 (обратный порядок слов)

Если мы для перекрывающихся пассажей уменьшили вес слова b вдвое, вместо Wb используем Wb/2:

Есть 2 пассажа, перекрываются с весом второго слова Wb/2:

W2=Сумма весов пассажей=Wab+Wba=(K1/2+K2/2)*Wa*Wb

Если бы в документе был учтен один пассаж А Б, а второй не учтен:

W1=вес документа Wab=K1*Wa*Wb

Теперь сравниваем W1 и W2. Теоретически должно быть W2 > W1, чтобы сумм вес перекрывающихся пассажей был выше, чем одного, мы ведь для этого все затеяли, иначе нет смысла извращаться с перекрыванием весов. Тогда:

K1/2+K2/2 > K1

=>

K2>K1

Т.е. вес пассажа с "обратным расстоянием" д.б. выше, чем вес пассажа с прямым расстоянием. Я думаю, это было бы нелогично.

Конечно, здесь есть предположение, что вес двусловного пассажа пропорционален произведению весов слов - считаю его разумным.

К
На сайте с 03.02.2005
Offline
74
#226
euhenio:
-вообще да, думаю, одинаковые. Но я бы все равно при оптимизации написал побольше слова aa - на всякий случай. Да и бб добавил бы.

Это принципиальный вопрос. В Ваших терминах, действительно, получается, что веса этих двух документов-предложений будут равны. Но, интуитивно, не кажется ли Вам, что документ [aa aa bb cc dd] желательно поместить в СЕРПе выше документа [aa bb cc dd] по запросу [aa bb] (при прочих равных)?

euhenio:
Будем предполагать (думаю, разумно), что вес двусовных пассажей пропорционален произведению веса А на вес Б.

Стоп! А откуда взялось произведение? Я с этим, как бы, не совсем согласен. Прошу пояснить, по возможности.

wolf
На сайте с 13.03.2001
Offline
1183
#227
Кот:
Стоп! А откуда взялось произведение? Я с этим, как бы, не совсем согласен

Я как бы тоже. Почему не сумма? Читаем у Сегаловича:


Наконец, веса словопозиций, взвешенные по сходству их полного контекста, «собираются» обратно и образуют вес документа.

Под "собираются" мне явно видится сумма.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
wolf
На сайте с 13.03.2001
Offline
1183
#228

И все-таки идея пересекающихся пассажей мне кажется неверной. Вижу два пути - "лишнее" вхождение какого-либо термина в пассаже игнорируется:

1) только на этапе прохождения кворума

2) как на этапе прохождения кворума, так и на этапе ранжирования

Всё-таки IDF на этапе прохождения кворума и этапе ранжирования расчитываются по-разному (степенная функция в первом случае и логарифм во-втором) Что мешает внести и другие различия?

К
На сайте с 03.02.2005
Offline
74
#229
wolf:
И все-таки идея пересекающихся пассажей мне кажется неверной.

Нам со стороны сложно судить, что именно прижилось в поиске и по каким причинам.

wolf:
1) только на этапе прохождения кворума
2) как на этапе прохождения кворума, так и на этапе ранжирования

Первое, имхо, логичнее т.к. получится учесть веса повторяющихся терминов при вычислении веса пассажа. Но возникнут сложности с "табулированным набором коэффициентов" - он же не резиновый, на все варианты "повторяемости терминов" коэффициентов, имхо, не напасешься :) В случае использования пересекающихся пассажей такая проблема не стоит.

wolf
На сайте с 13.03.2001
Offline
1183
#230
Кот:
Первое, имхо, логичнее т.к. получится учесть веса повторяющихся терминов при вычислении веса пассажа. Но возникнут сложности с "табулированным набором коэффициентов" - он же не резиновый, на все варианты "повторяемости терминов" коэффициентов, имхо, не напасешься В случае использования пересекающихся пассажей такая проблема не стоит.

По этапу прохождения кворума - тут вообще все довольно интересно. Мне кажется логичным, что каждый термин должен учитываться один раз, независимо от того, сколько раз он встречается в запросе или пассаже. Например, имеем запрос [a a b], где а - тяжелый термин. Должен ли пройти кворум пассаж [a b]? Если термин а в запросе учитывать дважды, то ведь может и не пройти.

А вот на этапе ранжирования должно учитываться всё, т.к. расстояния различные. И "табулированный набор коэффициентов" должен быть пусть не резиновый, но весьма обширный. Впрочем, не вижу тут никакой технической сложности. Вармантов, конечно много, но прописать их надо в наборе всего единожды и навсегда. Да и пользоваться терминологией "один, два и много" тоже не запрещено :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий