Теркин

Рейтинг
53
Регистрация
16.01.2005
Cage:
Все, теперь я все понял в Вашем эксперименте. Вы хотите вычислить коэффициент d (damping factor) в формуле расчета PR. Вы исходите из того, что Вам удастся выделить чистую двойку (PR=2) и чистую единицу (PR=1), на которую эта двойка ссылается.

Теперь я предлагаю записать правильную формулу PR :), подставив в нее Вашу двойку, единицу и 50 ссылок.

1 = (1-d) + d*(2/50)

Как нетрудно заметить, d=0 для любого количества ссылок. Почему?
А все потому, что Вы не обратили внимание на мои слова

Первое (1 - d) это статическая величина - начальный ПР страницы. В баре эта величина будет совсем не 1-d. Поэтому использовать данную формулу нельзя.

Второе коэффициент потерь это совсем не d и к этой формуле он никакого отношения не имеет. Обсуждать его я не хочу потому, что в рамках одного эксперимента это абсолютно бессмысленная величина, о чем я писал выше.

Что я действительно хочу узнать, так это сколько нужно ссылок с двойки, чтобы по одной из них передать единичку.

Cage:

Представьте, что PR на каком-то вымышленном нами баре отображается как
B = 100*корень(x),
где B - PR в баре, x - реальный PR.

Теперь представьте, что у нас есть две страницы:
стр.1 - x=0,01
стр.2 - x=0,04

Заметьте, что реальный PR второй страницы в 4 раза (больше), чем первой. Пересчитаем PR для нашего бара. Получим:
стр.1 - B=10
стр.2 - B=20

PR на баре для второрой страницы всего в 2 раза больше. Добавьте к этому то, что мы не знаем точную формулу пересчета для настоящего бара (но можем представить ее в общем виде), и то, что PR на баре еще и округляется до целого значения. Если Вы над этим задумаетесь, то поймете, что в Вашем подходе к расчетам масса проблем...

Обозначим функцию получения значения Вашего бара - СR (CageRank)

CR(x1 * x2) = CR(x1) * CR(x2)

CR(x1 / x2) = CR(x1) / CR(x2)

Две арифметические операции остались. Жаль только, что ссылки складываются и делятся, а сложение у Вас не работает. ;)

ref:

Теркин:
Откуда можно найти потери при передачи PR выраженные в том PR, который мы видим.

1. напишите по-русски, что вы хотели этим сказать.
2. ваша структура страниц не имеет обратных связей. А потому, не применима к реальным ситуациям.

1. Допустим получилось, что страница с ПР=2.0 имея 50 ссылок передает по одной ссылке ПР=1.0. Это является основным результатом этого эксперимента.

Потери выраженные в ПР который мы видим кажутся совсем не потерями, а наоборот приростом ПР, а все потому, что 2 на самом деле не 2, то же самое касается любого другого значения ПР, которые мы можем посмотреть. Я уверен что ПР передается одинаково по всем ссылкам со страницы. Чем больше ссылок на странице, тем меньше передается ПР по одной из ссылок. Откуда получается что 2 по одной из 50-ти ссылок должна передать 2/50 ПР = 0,04ПР соответственно в данном случае коэффициент потерь равен 25. По сути бесполезная информация, пока мы не докажем, что этот коэффициент будет таким же, для пары ПР3,ПР2. А для этого нужен второй эксперимент.

2. Заведите ссылки со страниц на последнем уровне дерева на главную и получите обратную связь, которая никак не повлияет на результат.

ref:
Видимо, автор считает, что сам скачок не зависит от начального значения пр... А вот почему он так считает? Впрочем, до конца не ясно, что, да как.

Не понял, что вы имеете ввиду под "скачком". Если ПР полученный в результате ссылки с другой страницы со своим ПР. То разумеется значение первого ПР зависит от значения второго.

maximumx:
Всё равно, эксперимент будет трудно повторить снова.

Совсем не трудно.

Cage, Понимаю.

Я так думаю, что меня не совсем понимают.

Еще раз об эксперименте.

Повторю все на картинке. На ней изображено четыре уровня дерева ссылок.

На первом уровне мы получаем какой-то ПР, достаточный для проведения эксперимента.

На втором уровне мы получаем необходимое количество страниц с одинаковым ПР.

На третьем уровне мы выделяем чистый ПР. У нас есть страницы, на которые стоят ссылки, со страниц (со второго уровня) с равным ПР. Но дело в том что количество ссылок на страницах второго уровня разное. Соответственно они передадут по одной ссылке разный ПР. Но он будет уменьшаться от одной страницы к другой. Допустим такой порядок ПР на страницах 2.3 | 2.1 | 1.9 | 1.7 все что нам нужно это найти то место где происходит переход от ПР2 к ПР1. Это у будет чистая двойка с небольшой погрешностью, которую легко определить. Если же начальный ПР (на первом уровне изменится), то этот переход просто напросто сместится.

Поэтому эксперимент можно повторить и не один раз. Разумеется он будет смещаться не бесконечно. При сильных изменениях начального пр переход исчезнет и появится новый от ПР3 к ПР2 или от ПР1 к ПР0.

На четвертом уровне происходит тоже самое, что и на третьем. Но мы уже выделяем не двойку, а 1-ку.

alut:
Теркин, Cage,
как полоучить ПР5 без внешних ссылок? А если они есть - все Ваши эксперименты - гадание на кофейной гуще. Любое изменение параметров существующих внешних ссылок приведет к большим изменениям, чем те факторы, на которых Вы собираетесь проверять идею. Поэтому Миха и говорил о нулевых сайтах.

Я писал одна - две внешних ссылок на сайт, для того чтобы получить PR=5.

Объясните, почему любое изменение во внешних ссылках сделает эксперимент неправдоподобным?

В эксперименте вообще не важно какой ПР будет взят изначально, главное чтобы на последнем уровне дерева ссылок получился не нулевой ПР хотябы на некоторых страницах, иначе вообще нельзя будет определить результаты.

pupkin:
Мне интересно, почему если с морды было 70 равноценных исходящих на внутренние, до до адресата они добрались либо как 3 либо как 4 , а не одинаково.

Cage, Наверное, речь идет о том, что будет либо 3, либо 4 на всех страницах одинаково.

Совершенно точно!!!

Shema:
Ничего не получится, так как PR=5 бывает PR=5.01 и PR=5.99
Притом первый от второго условно отличается в 2 раза. То есть одна ссылка PR=5.99 может сделать страницу вида PR=5.01, тогда как от PR=5.01 у вас может получиться, например, только PR=3.5

Для этого и нужны все эти страницы, чтобы на третьем уровне дерева ссылок (см. рис.) выделить точную двойку (либо тройку что получится) не 2.5, а 2.0. Разумеется, там будет маленькая погрешность, которую можно будет рассчитать только по завершению эксперимента (от 0,067 до 0,02), но это не так важно.

По сути, не важно какой PR будет изначально, можно взять 6 и больше если у кого есть :) Я взял 5, чтобы на последнем шаге у нас не оказались все страницы с нулевым PR. Если уточнить диапазон (30 - 100), то можно обойтись 4-ой, хотя рискованно, если ошибетесь, то потеряете как минимум 4-месяца.

alut:
- это как ?

1-е правило - эксперименты можно проводить только с новыми сайтами, иначе фактор помехи будет равен экспериментальным факторам.
P/S/ и прав Shema - Вы не сможете установить даже точного начального значения.

Cage, Скорее всего имеется в виду, что страница сайта не ссылается на другие сайты (т.е. содержит только внутренние ссылки).

Вы опять правы, и с данным правилом я тоже не согласен. Для разных экспериментов не могут быть одни правила. Хотя предполагается использовать новый сайт, так как реальную 5-ку подвергать таким экспериментам жалко. На сайт будет стоять одна - две ссылки с PR=6. Ссылки хорошие. Каждая из них точно дает 5. Чтобы обеспечить начальный PR.

В дополнение.

Реализация эксперимента очень проста. ЧПУ + простенький скриптик для расстановки ссылок + генератор контента, можно даже несвязанного (просто уникальную бессмыслицу, чтобы не склеили страницы).

Alexxx3:
А на морде всего только и есть, что одна ссылка из меню!!!

На морде ссылка из меню на ту страницу или с внутренней на морду? Может есть где на внутренних ссылки на главную с ключевиком. Ее Яндекс не покажет, а если сайт сильный или запрос слабый, то это и может быть причиной.

VBart:
Там вообще-то кажется Яху написано, а не Яша.

Вижу. Сразу полегчало так. Спасибо. ;)

NerZool:
Топикстартер и не говорил о бесконечном вИЦ. Но нплохо бы было, если бы такая сис-ма работала из 10 в 65 просто так - это круто. Но учтите, что Янд проиндексирует все ссылки разом, тобишь по кругу из 6 сайтов пройдет только один раз... Вотъ

Не просто так. 10 это текущий Виц, следующий 18,5 это Виц полученный в результате ссылки и не важно взаимная она или нет. Так что за счет взаимных ссылок получается рост с 18 до 65, то есть в 3.6 раза (Если Виц передается с такими потерями). Не стоит при этом думать, что PR (видимый аналог Виц) вырастет скажем с 2 до 8. Он скорей всего не изменится.

Дело в том что от такой системы не будет пользы. Для получения такого роста ссылка должна быть единственной. Если мы поставим вторую ссылку (не взаимную с сайта) то рост будет совсем другим.

10 10 0

18,5 14,25 4,25

22,1125 17,8625 7,8625

25,183125 19,3978125 9,3978125

26,48814063 20,70282813 10,70282813

27,59740391 21,25745977 11,25745977

28,0688408 21,72889666 11,72889666

28,46956216 21,92925734 11,92925734

28,63986874 22,09956392 12,09956392

28,78462933 22,17194421 12,17194421

28,84615258 22,23346747 12,23346747

28,89844735 22,25961485 12,25961485

28,92067262 22,28184012 12,28184012

28,9395641 22,29128586 12,29128586

28,94759298 22,29931474 12,29931474

28,95441753 22,30272702 12,30272702

28,95731797 22,30562745 12,30562745

с 18 до 29 максимум.

art213:

к слову

Яху стоит - $ 42.5 млрд
Гугл - $ 111.5 млрд

Пугающее соотношение цифр. Гугл работает не только в России. Пусть здесь его не ценят, но в других странах это далеко не так. Я сомневаюсь, что Гугл стоит только в два с мелочью раза дороже Яндекса.

Да не будет там бесконечного роста. Даже из вашей теории о том, что передается только 85% Виц-а.

В экселе напишите формулу и посчитайте.

Вот просчет для 30 пересчетов. Начальный Виц 10

10 10

18,5 25,725

31,86625 37,0863125

41,52336563 45,29486078

48,50063166 51,22553691

53,54170638 55,51045042

57,18388286 58,60630043

59,81535536 60,84305206

61,71659425 62,45910511

63,09023935 63,62670344

64,08269793 64,47029324

64,79974925 65,07978686

65,31781884 65,52014601

65,69212411 65,83830549

65,96255967 66,06817572

66,15794936 66,23425696

66,29911841 66,35425065

66,40111305 66,4409461

66,47480418 66,50358355

66,52804602 66,54883912

66,56651325 66,58153626

66,59430582 66,60515995

66,61438596 66,62222806

66,62889385 66,63455978

66,63937581 66,64346944

66,64694902 66,64990667

66,65242067 66,65455757

66,65637393 66,65791784

66,65923017 66,66034564

66,6612938 66,66209973

66,66278477 66,66336705

При времени равном безконечности Виц конечный.

Всего: 245