Сначала оценивают релевантность, а потом согласно этой оценке ранжируют. А не в процесе ранжирования выявляют наиболее релевантный документ.
Или это разные понятия...
Я говорил о ТИЦ, тему о ссылочном ранжировании затронул не я. Но раз вы видели все, то потрудитесь дать оба. И если возражений, подобных вашему, не будет, то занесете в википедию.
О моих знаниях: я просто формулирую определения. Если формулировка не верная, я готов поменять. Я не говорю категорично, я не видел всего.
Miha Kuzmin (KMY), уважаемый вы все видели - дайте свой вариант определения. А я в свою очередь посмотрю на очередной перл...
ранжирование это процес, а не величина.
Поэтому, с Вашего позволения, переформулирую Ваше определение:
Ссылочное ранжироване - это ранжирование по ТИЦ.
midian777, если я скажу, что не знаю, что такое "ссылочное ранжирование", то Вы дадите определение этого понятия?
О ранжировании я не говорил. А говорил о некоторых условных величинах, которые, предположительно, могут использоваться как факторы ранжирования.
Мне кажется вполне логично, что либо ИЦ, ВИЦ, ТИЦ это о сайтах либо о страницах. Если о страницах, то используя величины для страниц, простым суммированием можно получить аналогичные валичины для сайта. Надо определиться с понятиями и переделать определения. И лишь потом говорить о степени влияния факторов.
Если ссылки не взвешеные, то мы просто даем их количество. Если взвешиваем, то суммируем их веса. Формулировку менять не буду.
Относительно ТИЦ, спорить не буду. Меняю формулировку:
ТИЦ - это число, которое получается из суммы весов ссылок, где веса определяются в зависимости от тематической близости ссылающегося сайта (страницы) и данного сайта (страницы сайта).
Я правильно понял: при индексации каждому слову соответсвуют страницы, где встречается это слово и эти страницы упорядочены по весу слова на этой странице?
Если я понял правильно, то при такой структуре возникнет проблема при выборке страниц при запросе из нескольких слов. Надо будет найти пересечение по множествам (страниц), которые соответствуют разным словам, а это будет сделать проще, если страницы упорядочены по индексу.
Выше было высказано много предположений, которые сложно проверить. Позволю и себе некоторые теоретические предположения.
Сначала хочу ввести некоторые определения для понятий, которыми буду оперировать, (в одной из тем предлагали обсудить определения, но это скорее всего не реализовано).
ВИЦ (возможно используется Яндексом) - сумма весов страниц, которые ссылаются на данную; алгоритм подсчета упомянутых вессов неизвестен.
ТИЦ - это частный случай ВИЦ, где веса определяются в зависимости от тематической близости данной страницы и ссылающихся.
Заметим, что PR это частный случай ВИЦ, где веса расчитываются по всем известной формуле с никому неизвестными модификациями:)
Могу предложить частный случай расчета ТИЦ: берем ссылку на данную страницу, и оцениваем, на сколько текст ссылки релевантен тексту данной страницы. Полученая релевантность будет весом.
При расчете PR можно при суммировании PR-ков умножать их на релевантность текста ссылки тексту данной страницы.
С учетом выше сказаного, тематические ссылки должны давать больше, чем нетематические (на сколько больше неизвестно, зависит от коэфициентов, которые вбили разработчики) при одинаковом ВИЦ ссылающихся страниц.
К вопросу о факторах, которые зависят/не зависят от запроса: еще одно теоретическое предположение.
Можно в качестве весов использовать релевантность текста ссылки введенному запросу.