Разработчик, надо. Не было бы таких постов
di_max, прочтите пожалуйста 2 предыдущие страницы, поймете почему ваш вопрос (в т.ч. цитата Юни) некорректен.
юни, уже лучше.
И все же, получается ссылка с адалтсайта оформленная текстом, релевантным ее анкору (надеюсь вы поняли, почему не запросу) будет релевантнее чем неоформленная текстом ссылка с турсайта п.п.р.
Постарался объяснить на пальцах, почему мало учитывать только окружение ссылки и нужно смотреть релевантность всего документа анкору ссылки.
юни, [скромно] что курим? :D
даже не знаю с чего начать...
что такое тематика документа?
что такое тематический запрос?
почему вы считаете, что ссылка с турсайта на турсайт не оформленная текстом (скажем, верстка такая) должна быть идентична ссылке с адалтсайта при прочих равных? (а если на адалтсайте ее еще оформить текстом.....)
юни, честно - не осилил вашу идею :)
Вы предлагаете при запросе считать более релевантными ссылки с документов-доноров релевантных запросу?
В таком случае при каждом новом запросе придется заново считать релевантность документов-доноров запросу, что невозможно делать онлайн.
Альтернативный способ я описал выше.
Юни, тут Сергей прав.
Давайте отталкиваться от следующих постулатов
1) Тематика сайта (ЯК) не играет роли в ранжировании документов этого сайта.
2) Определить тематику страницу (аналогичную ЯК) невозможно по ряду причин, особенно "на лету".
Теперь определимся с целью
1) Отсеять нетематические морды, линкообмен.
Вот один из вариантов:
Еще один постулат
3) На сайты ставят релевантные им ссылки. Т.е. ссылка с анкором "кондиционеры" ведет на сайт фирмы занимающейся климатикой.
Тогда достаточно проверить релевантность текста документа-донора каждой (внешней?) ссылке, что технически просто реализуется (вследствие нечастой индексации, небольшому количеству внешних ссылок, использованием фильтров, упоминавшихся выше). Т.е. для каждой ссылки получим "коэффециент соответствия", который можно использовать при расчете релевантности.
Замечу, что таким образом мы полностью абстрагируемся от документа-акцептора, считая "коэффициент соответствия" один раз для каждой индексации документа-донора. Ни о каком подсчете "на лету" речи не идет.
Это теория.
wolf, по сабжу я уже ответил - яндекс не учитывает окружение ссылок как дополнительный фактор при расчете релевантности.
Вопрос перешел в русло "А как возможно учесть "тематику" при ранжировании, влияет ли "тематическая близость" документов на эффект от ссылок?"
В моем посте было 2 варианта (это не предел) - релевантность запросу и релевантность анкору ссылки. Второй случай не требует подсчета "на лету". Кроме того, если наложить фильтрующие факторы на учет такой релевантности (любые - вес страницы, стоп-слова в анкоре, etc) количество операций уменьшится на порядок.
P.S. Я не утверждаю что это используется, а лишь рассматриваю наиболее возможные варианты реализации.
P.P.S. Говоря проще, народу интересно - фильтруются ли нетематические морды или нет :D Пока нет (имхо).
Виктор, 🍻
Поздравляю!
факты, факты....
я могу сказать, что довольно сложно определить тематику многих документов (если не скатываться до "универсальное"), но довольно легко определить релевантность запросу. Так что я склоняюсь ко второму варианту.
Все верно (за исключением термина определения тематики документа - я пока не видел таких примеров). Текст около ссылки ничем не отличается от остального текста на странице. Поэтому говорить об учете именно окружения ссылки некорректно.
не более чем обычный текст документа. То что он стоит около ссылки не влияет ни на что ;)