Rev

Rev
Рейтинг
151
Регистрация
18.10.2003
Должность
подпольный пессимизатор

Artisan

Так я об этом и пишу, время вычислений при запросе должно быть не очень большим, то есть для вычислений по алгоритму HITS надо выбрать не очень большое подмножество документов, и выбирать его можно согласно PageRank / вИЦ который надо посчитать предварительно то есть не во время запроса для всех документов в базе поисковой системы.
Тут путаница в терминологии. Индекс Цитирования - неудачный термин, поскольку по сути индекс это не цифирь, а дерево ссылок на те или иные объекты. Так вот, индексы конечно строятся заранее, но если ранжирование зависит от запроса, то почему не предположить что индекс мультизначный?
Там он не является независящим от запроса фактором.

Именно в этот эффект я и уткнулся! Долго не мог это истолковать, пока не плюнул на вИЦ.

Имеем: по умолчанию учитывается какой-нибудь фактор (например, текст входящих ссылок) без ограничений. Потом подразумеваем, что на него могут накладываться определенные фильтры, (т.е., напр., отфильтровываться (не учитываться) некоторые из этих ссылок по определенным правилам, например, сквозные с сайта). Т.е. фактор работает, но при соблюдении определенных четко описываемых ограничений.

Разница в следующем:

Вы утверждаете в необходимости сбора всех грибов с поляны с избавлением от поганок на следующем этапе...

С моей точки зрения, сбор только съедобных грибов сэкономит нам время и ресурсы.

Но ведь Ваша уверенность, что "ВИЦа нет", на чем-то ведь зиждется?

Естественно! Эта уверенность опирается на экспериментальный материал. Еще не забыли схему эксперимента предложенную AiK? Вот с подобных экспериментов, но более тонких все и началось. Не было у меня цели выяснять существует или нет вИЦ и сомнений не было. Было желание разобраться с его влиянием на ранжирование, а в результате пришел к полному отрицанию его существования... Во всяком случае в том классическом виде как это описывается многочисленными толкователями PR. Выводов может быть несколько. Либо вИЦ не является аналогом PR, либо он не существует. Я склонен считать, что этот индекс прекратил свое существование, хотя принципы и факторы изначально заложенные в PR в том или ином виде явно сохранились в теле алгоритма ранжирования. О формах и принципах можно спорить, но спор этот, к сожалению, будет беспредметным по определению.

Это проще для понимания.

Где уж там? Когда сам алгоритм ранжирования по сути является фильтром...

wolf

Более весомо выглядело бы
Да, выглядело бы, кабы знать алгоритм, но кто ж его нам покажет?

wolf

Фильтры у них на ссылочное по-разному работают, вот и все дела.
Ну почему сразу "фильтры"? Учетная политика разная.

wolf

А вообще, похоже, Rev намекает на то, что типа сейчас в Яндексе имеет место не классический алгоритм PageRank, а что-то другое (ну, HITS, например), где нет понятия скалярной величины авторитетности документа, рассчитываемой на основе ссылок на него и не зависящей от запроса (что мы и понимаем по ВИЦ).
Какие уж тут намеки? Местные зубоскалы уже животики успели подорвать, Вы все "намеки"...
Песня знакомая, и я догадываюсь, кто её напел...

Начинается... Впрочем, это Ваши проблемы. Можете оставаться при своем мнении :)

Kostya

что верно то верно, статический фактор - вИЦ страницы в Яндексе не играет такого решающего значения как скажем в Гугле.
Так ли все просто с Гуглом? Но, тут я лучше промолчу (пока) :)
вИЦ не нужно оптимизатору вычислять, его нужно чуствовать

Да, да! Только каким местом? :)

Lisa, тихо, Кузьмин услышит. :)

Хм... Кабы знать сколько их до того было... :)

Неужели для кого-то это важно?

Всего: 2868