Фриман

Фриман
Рейтинг
50
Регистрация
11.11.2005
baltic13:
позиции в ПС выстроены по релевантности, а релевантность 1ой позиции от 2ой может отличаться

есть такой термин в математике - порядковая величина. Яндекс нам выдает релевантность как раз в виде порядковой величины. Я не спец, но в курсе что и там есть свои подходы.

baltic13:

к сведению линейно - это значит f(x)= a+ b*x , а при вашем подходе позиции могут быть одинаковыми при любых видах функции, если она возрастающая и непрерывная.

спасибо за определение линейной функции, перейдем к функции ссылочной релевантности:)

R = f(aTF, IDF, aIDF)

aTF - меняем ЛИНЕЙНО;

IDF - как хотим;

aIDF - константа.

Можно проследить характер функции по порядковым значениям релевантности?

baltic13:
и что в итоге получим? позиции сайтов. как вы собираетесь анализировать эти данные?
в лучшем случае из этого эксперимента получите, что передача веса зависит от IDF, что и так понятно. А линейна или нет - не получиться выяснить.

Мы линейно изменяем один из параметров (aTF), если документопозиции также будут меняться линейно, значит зависимость - линейная, если как-то иначе ... Вобщем характер читается.

Borya:
Это да. Но мы не можем установить, что 3<Pi<4, мы устанавливаем, что X1<Pi<X2. Так вот, как можно быть уверенным, что X1+1 = X2? То есть анкорные веса слов неизвестны. Мы можем делать предположения на основе предыдущих экспериментов, но если наш X2 в реале окажется не 4, а 10, то и с выявлением линейности/нелинейности возникнут проблемы.
Надеюсь, я понятно написал...

Зачем нам абсолютные значения весов если есть отношение, полученное в ходе эксперимента? Известна точка, где X2*aTFx2==X1*aTFx1, больше ничего не нужно. Берем некую область вокруг этой точки, квантируем и заряжаем сайты. Получаем результат, делаем вывод о функциональной зависимости.

Интервал - от и до, полученные в проведенном вами эксперименте. Ну например, мы грубо установили что 3<Pi<4, зачем в уточняющем эксперименте рассматривать интервал 1-10?

С точностью до идеи:

1. Фиксируем интервал на данную пару слов.

2. Создаем и индексируем через addurl N одинаковых документов с одним вхождением каждого из слов.

3. Дождавшись индексации, убеждаемся в эквивалентности значений релевантности.

4. Ставим ссылки с одной и той же страницы на все документы, длина ссылок = 64 слова, коннцентрации распределены согласно доверительному интервалу.

Borya Зависит от того, какой доверительный интервал. В ходе проведенного эксперимента он должен был проясниться.

А методика есть и довольно прозрачная.

aTF*IDF*IDFa, неоднократно утверждал Wolf. Да, цитируемость у него... Скоро Каширина обгонит. И последнему придется менять текст на сайте:)

Да, коллеги. Было бы из-за чего жадничать%)

_S_ X7-1-2-3-4-5-7-9-11-6-10-8-12-13-14-16

аналогичен || %зюзик

_S_:
А вес "%gsgrejhjhksgtgrrthr" - не присваиваете?

Можно присвоить, ничего не меняется (% нивелирует)

да, естественно

Всего: 250