upyrj

upyrj
Рейтинг
140
Регистрация
17.09.2005
Должность
SEO

Miha Kuzmin (KMY), по мне так запросонезависимая штука.

Типа как в индексе расставлены границы пассажей, так оно и есть до следующей индексации.

Господа, давайте не будем вторгаться на территорию лингвистики. Потому как только безумный лингвист скажет вам, что точно знает, что такое естественно-языковое «предложение» и по каким принципам мы расставляем точки.

Тем более все сложно в вебе, где, как заметил wolf, есть еще и менюшки, списки и прочая ерунда.

Почему хочется пользоваться термином «пассаж», а не «предложение»:

- дополнительные лингвистические проблемы и школьные коннотации у «предложения».

- активное использование именно термина «пассаж» в «Яндекс на РОМИП».

Хотите определений — давайте попробуем:

Пассажи — непересекающиеся отрезки, на которые Яндекс разбивает документ (в том числе его анкор-лист) и которые характеризуются рядом важных свойств.

Важные свойства пассажа:

(i) по пассажам рассчитывается (текстовая) релевантность документа (см. «Яндекс на РОМИП»);

(ii) внутри пассажа определено междусловное расстояние (оператор &/(расстояние));

(iii) между пассажами в теле документа определено межпассажное расстояние (оператор &&/(расстояние));

(iv) два слова из одного пассажа могут быть найдены (?=подсвечены) по запросу «слово1 & слово2» (следствие из (ii));

(v) два слова из разных пассажей не могут быть найдены (?=подсвечены) по запросу «слово1 & слово2» (следствие из (ii));

(vi) только первый пассаж, входящий в текст ссылки, может попадать в анкор-лист акцептора.

Список свойств можно расширять и дополнять. Свойства пассажа могут (с определенными оговорками) использоваться при анализе как признаки пассажа.

Уточнения приветствуются. 8)

pro-maker:
Можете показать пример с одним пассажем на три предложения (точка+пробел), который учтен в ссылочном?

Разве что описание из Яка или другого козырного каталога.

Ну и есть еще один очень глючный примерчик, обсуждать каковой я пока не готов. 8)

PS: Пока писал, тут много всего понаписали. Так что простите, если где набаянил. 8)

pro-maker:
Почему именно "пассаж", а не "предложение"?

Потому что Яндекс оперирует пассажами, а не предложениями. Конечно, «пассаж» — это некоторое приближение к предложению, но не более того.

Я ведь могу написать

предложение так, что

оно окажется состо-

ящим из 4 пассажей. 8)

А могу написать 3 предложения, которые окажутся одним пассажем.Это совсем несложно, хотя и немножко некрасиво.Согласны?

Кроме того, если пытаться говорить о предложениях, то мы увязнем не только в непонимании того, как Яндекс их выделяет, но и в том, что такое предложение в русском языке или в языке вообще. А это далеко не очевидный вопрос.

Есть несколько факторов влияющих на разделение пассажей знаками препинания.

1. Сам знак препинания.

2. Наличие пробела после него.

3. Наличие большой буквы после него.

Так вот все эти комбинации я не проверял, но знаю, что конструкция «двоеточие + пробел + маленькая буква» не разделяет пассажи, а значит, ее можно без опаски использовать в анкорах.

Короче, Миха прав, Лев Павлович придумал какую-то кривую проверку, Плеймейкер, кажется, не в теме. 8)

Такая конструкция (точка без пробела) не делит пассажи, так что ставить такую ссылку можно.

Проверяется очевидно.

С однословниками тоже все странно выглядит. Попробуйте попробивать запрос «здесь». Разница очевидна.

Видимо, минус-часть теперь как-то влияет на релевантность пассажей и на кворум. 8/

Кажется, если найдено вхождение в текст, то Яндекс выбирает самые длинные и самые релевантные пассажи.

Если не нравится то, что он выводит, попробуйте соответствующий пассаж укоротить (разбить на предложения или <br /> повставлять), а нужный пассаж удлинить.

psu:
использовать запрос ~~abrakadabranew...

А все равно «Найдено по ссылкам» срубается. 8(

Сдается мне, что техника «пробивания кеша» минус-словом с недавних пор стала некорректна.

То есть добавление минус-слов в запрос заметно меняет принципы ранжирования.

К примеру, в «пробитом кеше» практически не бывает «найденного по ссылкам».

Короче, есть над чем подумать. 8/

«Песочка» нету никакого. Свежие сайты очень быстро начинают передавать ссылочное.

Про остальное — не знаю.

Всего: 2001