Неужто можно одлелить с помощью языка запросов страничную составляющую релевантности от ссылочной?
Не надо путать результаты работы операторов anchor#link или $anchor с реальным учетом ссылочного.
Понятно. Короче, резюме из этого можно сделать следующее - как влияет одинаковость ссылки - фиг ее знает. :) То есть алгоритм поведения при размещении ссылки на конкретном доноре остается неясным - делать ли её текст уникальным или же использовать уже имеющиеся.
Гм, а на основании чего такие мыслишки родились? Ведь из пальца такое высосать можно только при наличии весьма буйной фантазии. :)
Что и требовалось доказать. :)
Теперь разбираем Ваши высказывания по полочкам. Чувствуется, что Вы путаетесь в терминологии. Вот тут:
Вы употребляете слово "частота". А потом, оказывается, что Вы подразумевали под ней просто кличество вхождений. Меж тем, под частотой в этом топике как бы подразумевается именно плотность, обозначаемая в литературе по IR как tf (term frequency) (см. термин "внутри-документная частота" у яндексоидов).
В общем, уточнив терминологию приходим, что Вы имеете в виду что главный критерий определения релевантности - это количество упоминаний термина, нормированное по количеству упоминаний самого частотного термина?
Т.е. max (N) max (N/Nmax)
В итоге имеем, что макимум веса документа по отношению к конкретному термину достигается тогда, когда он самый упоминаемый и количество его упоминаний в тексте стремится к бесконечности? Теперь я Вас правильно понял?
Ну там просто явная нелепица была с учетом регистра при использовании оператора "ИЛИ". Именно поэтому, думаю, они ее и исправили, а не для того, чтоб отравить жизнь вам в шефом. Хотели отравить - убрали бы переколдовку из подсветки. ;)
Поясните Вашу мысль - это происходит с увеличением анкор-файла (т.е. с увеличением количества уникальных ссылок) или просто с количественных увеличением числа ссылок вне зависимости от уникальности их текста?
Ок, действительно, ошибся. Ну, что ж, в таком случае всё выглядит весьма любопытно.
В общем, поясню немного своё видение того, как оценивается ссылочное ранжирование. Тексты всех ссылок (или анкоры) собираются в один анкор-файл, причем некоторые ссылки могут обрезаться по определенным правилам (например, они ограничены по числу слов в них). Каждый анкор считается отдельным пассажем, которому присваивается некий вес, зависящий от статического ранга страницы-донора. Если определенный пассаж уже есть в файле, то новый такой же не добавляется, а просто увеличивается вес находящегося в базе пассажа. Потом вычисляется вес этого файла по отношению к определенному поисковому запросу по методу, схожему с определением веса обычного документа по отношению к запросу, но не обязательно идентичному ему.
Самый интересный вопрос - насколько увеличивается вес пассажа при обнаружении такого же анкора? Просто ли там аддитивность или что-то более навороченное? Теряется ли в конечном итоге ли что-то по сравнению с тем случаем, если бы этот анкор был посчитан уникальным и образовал бы отдельный пассаж в файле? Тут, думаю, без поллитры не обойтись. :)
Скажем так. Доказательств правильности этой гипотезы у меня пока нет. Равно как и доказательств её неправильности. Поэтому с равной долей верятности допускаю и то и другое. :)