есть такой термин в математике - порядковая величина. Яндекс нам выдает релевантность как раз в виде порядковой величины. Я не спец, но в курсе что и там есть свои подходы.
спасибо за определение линейной функции, перейдем к функции ссылочной релевантности:)
R = f(aTF, IDF, aIDF)
aTF - меняем ЛИНЕЙНО;
IDF - как хотим;
aIDF - константа.
Можно проследить характер функции по порядковым значениям релевантности?
Мы линейно изменяем один из параметров (aTF), если документопозиции также будут меняться линейно, значит зависимость - линейная, если как-то иначе ... Вобщем характер читается.
Зачем нам абсолютные значения весов если есть отношение, полученное в ходе эксперимента? Известна точка, где X2*aTFx2==X1*aTFx1, больше ничего не нужно. Берем некую область вокруг этой точки, квантируем и заряжаем сайты. Получаем результат, делаем вывод о функциональной зависимости.
Интервал - от и до, полученные в проведенном вами эксперименте. Ну например, мы грубо установили что 3<Pi<4, зачем в уточняющем эксперименте рассматривать интервал 1-10?
С точностью до идеи:
1. Фиксируем интервал на данную пару слов.
2. Создаем и индексируем через addurl N одинаковых документов с одним вхождением каждого из слов.
3. Дождавшись индексации, убеждаемся в эквивалентности значений релевантности.
4. Ставим ссылки с одной и той же страницы на все документы, длина ссылок = 64 слова, коннцентрации распределены согласно доверительному интервалу.
Borya Зависит от того, какой доверительный интервал. В ходе проведенного эксперимента он должен был проясниться.
А методика есть и довольно прозрачная.
aTF*IDF*IDFa, неоднократно утверждал Wolf. Да, цитируемость у него... Скоро Каширина обгонит. И последнему придется менять текст на сайте:)
Да, коллеги. Было бы из-за чего жадничать%)
_S_ X7-1-2-3-4-5-7-9-11-6-10-8-12-13-14-16
аналогичен || %зюзик
Можно присвоить, ничего не меняется (% нивелирует)
да, естественно