Про разделители («.» «?» «!» «,») в анкоре ссылки.

[Удален]
#201

Ненене. Тут, если как ты говоришь, то слова стоят одинаково:

Муй буй

Муй буй

А если как я, то разбивка на разные предложения все же влияет даже в пределах одного, как ты выражаешься, пассажа.

К
На сайте с 03.02.2005
Offline
74
#202
euhenio:
А вот насколько...

А это уже потом выяснится. На этапе вычисления веса пассажа.

DM
На сайте с 21.02.2007
Offline
31
#203

ИМХО Если бы пассажи в Я были запросонезависимые и определялись знаками препинания или тегами html'я, то Я затруднялся бы искать фрагменты текста, состоящие из нескольких предложений. А т.к. такой поиск особых затруднений не вызывает, то скорей всего пассажи формируются только в соответствии с переколдовкой конкретного запроса.

wolf
На сайте с 13.03.2001
Offline
1183
#204
D.Mich:
то скорей всего пассажи формируются только в соответствии с переколдовкой конкретного запроса.

А вот в этом и суть религиозного спора. Что там именно формируется - пассажи или что иное :) Ведь культовое слово - пассаж. И что это такое есть - вот в чем суть :)

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
_S_
На сайте с 12.01.2006
Offline
109
_S_
#205
D.Mich:
ИМХО Если бы пассажи в Я были запросонезависимые и определялись знаками препинания или тегами html'я

А как же разбиение на определенное количество слов? :)

Читаешь блог? () Сайт о холодном оружии (http://bladeist.ru)
DM
На сайте с 21.02.2007
Offline
31
#206
wolf:
А вот в этом и суть религиозного спора. Что там именно формируется - пассажи или что иное :) Ведь культовое слово - пассаж. И что это такое есть - вот в чем суть :)

Ну я отталкивался от формулировки, которую дал господин Денис Иванов:

upyrj:

Пассажи — непересекающиеся отрезки, на которые Яндекс разбивает документ (в том числе его анкор-лист) и которые характеризуются рядом важных свойств.

Вроде по-поводу самой формулировки особых нареканий не было, так что я посмел исходить из неё :)

_S_:
А как же разбиение на определенное количество слов? :)

Разбиение запроса? (Или я неправильно понял вопрос?) А оно есть? И "определенное количество слов" чем должно определяться? ЕЖЕЛИ разбиение есть, то тогда практически 100% пассажи запросонезависимы. Но ИБО тому нету подтверждения (ну по-крайней мере у меня), то всё может быть.

И ещё, я не утверждаю, что пассажи запросозависимы (не имею должного опыта чтобы это определить и тем более авторитета чтобы это утверждать). Я просто привёл фактор на это указывающий :)

wolf
На сайте с 13.03.2001
Offline
1183
#207
D.Mich:
Ну я отталкивался от формулировки, которую дал господин Денис Иванов:

Цитата:
Сообщение от upyrj
Пассажи — непересекающиеся отрезки, на которые Яндекс разбивает документ (в том числе его анкор-лист) и которые характеризуются рядом важных свойств.

Под эту формулировку можно много чего подвести. Например, разбивку текста на предложения.

В общем, я как бы почти готов согласиться со сторонниками запросозависимого пассажа. Меня смущают только следующие вещи:

1) Получается, что в случае условия "слова должны быть в одном документе", получаем один единственный пассаж, включающий в себя все упоминания терминов запроса в документе.

2) Если, как говорит, Женя Трофименко, все левые слова из пассажей выкидываются, то что в примере пассажей из http://company.yandex.ru/articles/romip2004.xml :


Предположим, ранжирование пассажей рассчитывается без взвешивания каждой позиции. Пусть задан запрос [aa BB cc dd], где BB - самое «тяжелое» слово. Из двух пассажей:

• [aa __ BB __ cc dd ee]

• [aa BB cc dd __ __ ee]

Яндекс предпочтет тот, в котором окружение более тяжелого слова [BB] больше похоже на его окружение в запросе, то есть второй. Тогда как остальные, известные мне алгоритмы взвешивания пассажей [14], [15], будут считать веса обоих пассажей одинаковыми.

делают слова ee, которых нет в запросе?

К
На сайте с 03.02.2005
Offline
74
#208
wolf:
1) Получается, что в случае условия "слова должны быть в одном документе", получаем один единственный пассаж, включающий в себя все упоминания терминов запроса в документе.

Как вариант - порождаются несколько пассажей. Это уже обсуждатось в свое время.

wolf:
2) Если, как говорит, Женя Трофименко, все левые слова из пассажей выкидываются, то что в примере пассажей из http://company.yandex.ru/articles/romip2004.xml делают слова ee, которых нет в запросе?

К сожалению, мы вынуждены в своих рассуждениях отталкиваться от тех скудных сведений, что содержатся в официальных (и не очень) документах. Но изначально предполагая, что все эти сведения строго соответствуют действительности, мы пришли к некоторым противоречиям :) Самое время предположить, что (сознательно или нет) нас водят за нос :)

wolf
На сайте с 13.03.2001
Offline
1183
#209
Кот:
Как вариант - порождаются несколько пассажей. Это уже обсуждатось в свое время

Возможно, пропустил. Должно быть некое правило формирования пассажей. Допустим, оно зависит от запроса. Логично предположить в первом приближении на основании статьи Сегаловича, что правило следующее - как только в отрезке текста, удовлетворяющем контектсным ограничениям запроса (в документе, в предложении, на расстоянии в N предложений или слов, и т.д.) встретятся достаточное количество слов из запроса, чтобы преодолеть кворум, то пассаж считаем сформированным и начиная со следующей словопозиции ищем новый пассаж. Как бы логично. Но давайте рассмотрим конкретный пример.

Фраза [aa bb]. Условие - слова должны встречаться в одном предложении.

Имеем предложение [aa bb cc aa]. Как оно разобъется на пассажи? На пассаж [aa bb] (он проходит по кворуму, и начиная со слова сс по сделанному выше предположению можно начинать искать следующий пассаж, но конструкция [cc aa] уже по кворуму не проходит)? Или же все-таки на пассаж [aa bb _ aa]? Наблюдения за подсветкой говорят в пользу второго. В общем, для меня остается неясным правило формирования запросозависимого пассажа. Каков критерий того, что пассаж полностью сформирован?

К
На сайте с 03.02.2005
Offline
74
#210
wolf:
Возможно, пропустил.

Весной, на форуме у euhenio.

wolf:
Должно быть некое правило формирования пассажей.

Должно. Считаю этот вопрос самым важным, ключевым.

wolf:
Логично предположить в первом приближении на основании статьи Сегаловича, что правило следующее - как только в отрезке текста, удовлетворяющем контектсным ограничениям запроса (в документе, в предложении, на расстоянии в N предложений или слов, и т.д.) встретятся достаточное количество слов из запроса, чтобы преодолеть кворум, то пассаж считаем сформированным и начиная со следующей словопозиции ищем новый пассаж. Как бы логично. Но давайте рассмотрим конкретный пример.

Фраза [aa bb]. Условие - слова должны встречаться в одном предложении.

Имеем предложение [aa bb cc aa]. Как оно разобъется на пассажи? На пассаж [aa bb] (он проходит по кворуму, и начиная со слова сс по сделанному выше предположению можно начинать искать следующий пассаж, но конструкция [cc aa] уже по кворуму не проходит)? Или же все-таки на пассаж [aa bb _ aa]? Наблюдения за подсветкой говорят в пользу второго. В общем, для меня остается неясным правило формирования запросозависимого пассажа. Каков критерий того, что пассаж полностью сформирован?

wolf, возможно, Вы все сильно упрощаете. Важный вопрос: формируются пассажи по простым принципам (типа описанного Вами) или они (пассажи) могут пересекаться. Если допустить, что пассажи формируются по сложным правилам, допускающим пересечения, то, как вариант, предложение [aa bb cc aa] при запросе [aa bb] разобьется на два пассажа [aa bb] и [bb _ aa]. Что находится в согласии с подсветкой, кстати.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий