PR - теоретические исследования

wolf
На сайте с 13.03.2001
Offline
1183
1590

Тема зародилась здесь: http://blog.promosite.ru/comments.php?294

Автор предложил перенести дискуссию сюда. Переношу. Итак, Жень, докажи, что то, как ты считал, и то, как я предложил - это одно и то же.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
euhenio
На сайте с 21.09.2001
Offline
357
#1

Сначала докажу для случая, когда в структуре нет висящих страниц, т.е., для описанного случая. Т.е., когда на каждую страницу есть ссылка извне и с каждой страницы есть ссылка на другую.

В блоге речь идет по факту про site rank, т.е., по хостам. Суть неважно.

Случай 1)

Формула: Pi=(1-d)+d*sum(Pj/Cj)

В системе N страниц, т.е., N уравнений. После каждого прохода проводится нормировка на то, чтобы сумма Pi равнялась N.

Смысл Pi: величина порядка 1, т.е., не вероятность, а вероятность, умноженная на N.

Чем удобно: что величины Pi сравнимы друг с другом и не меняются при увеличении N.

Просуммируем левую и правую части по всем N уравнениям. Получится:

sum(Pi)=N(1-d)+d*sum(Cj*Pj/Cj)

---

В правой части уравнений входит PR страницы j, деленный на число ссылок с этой страницы (Cj). Но тогда этот член (Pj/Cj) входит в правую часть Сj раз (сколько ссылок, столько раз и входит).

Итого:

sum(Pi)=N(1-d)+d*sum(Pi)

(1-d)*sum(Pi)=N(1-d)

sum(Pi)=N

Хинт: в строгом случае нормировка не нужна. Т.е., она естественным образом выполняется.

***

Случай 2)

Все примерно то же, но смысл PR - вероятность (одного юзера запустили гулять в интернет из N страниц, в отличие от предыдущего случая, когда запустили N юзеров), величина порядка 1/N.

Что неудобно: что при изменении числа страниц в системе сравнивать PR и отслеживать его изменения неудобно.

Формула: Pi=(1-d)/N+d*sum(Pj/Cj)

--

Аналогично получаем, что

(1-d)*sum(Pi)=N(1-d)/N

sum(Pi)=1

Нормировка, естественно, не нужна.

***

Что достаточно сделать:

Поделить всю формулу из 1 случая на N:

Pi/N=(1-d)/N+d*sum(Pj/Cj)/N

И мы переходим ко 2 случаю:

{Pi/N}=(1-d)/N+d*sum({Pj/N}/Cj)

***

Однако, есть и хитрости. Случай с отсутствием висящих страниц я специально создавал, вычищая их. А в реальности (Яндекса) висящие страницы есть в числе, примерно равном "невисящим" т.е., учитывать это придется.

Кроме того, полностью избавиться от висящих страниц сложно. Например: Страница A->B->C->D

D выбрасываем как висящую - С становится висящей, выбрасываем ее - B становистся висящей. В приведенном случае сумма левой части уравнения отличалась от N на 1% примерно, для этого я все-же нормировал.

Доказательство же для случая с висящими страницами надо еще обдумать.

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
wolf
На сайте с 13.03.2001
Offline
1183
#2

Ок, по уравнениям убедил.

А по поводу висящих страниц, так Брин с Пейджем писали, что они отбрасывают их при составлении системы, считают, а потом по формуле вычисляют для них значения PR. В сумме в итоге, конечно, больше 1 получается.

euhenio
На сайте с 21.09.2001
Offline
357
#3

Кстати. :)

Когда-то, давно-давно, когда висящие страницы имели серенький бар, я задался вопросом - сколько таких "шагов" при вычищении висящих страниц делает Гугль. Создал 7 субдоменов (Professor их помнит :)) и сделал цепочку. Не успел там PR рассчитаться, как Гугль стал показывать нормальный зеленый бар для висящих страниц. Так и не узнал.

А практически это дырочка хорошая могла бы быть :).

samolet
На сайте с 23.05.2005
Offline
61
#4
...Страница A->B->C->D D выбрасываем как висящую - С становится висящей, выбрасываем ее - B становистся висящей...

я конечно ньюб и может не втыкаю - а если с D идет линк на A - то D все равно "висящая"?

wolf
На сайте с 13.03.2001
Offline
1183
#5
а если с D идет линк на A - то D все равно "висящая"?

Нет. Висящая - это та, с которой никуда линков нет.

samolet
На сайте с 23.05.2005
Offline
61
#6
Нет. Висящая - это та, с которой никуда линков нет

если удаляюсь от темы - порежьте посты, но по мне так с любой странице как правило идет линк хотя б на главную (меню, например)

wolf
На сайте с 13.03.2001
Offline
1183
#7
но по мне так с любой странице как правило идет линк хотя б на главную

Далеко не всегда. Есть масса примеров висящих страниц. Например, увеличенные картинки, открывающиеся в отдельном окне. Или так называемые версии для печати.

samolet
На сайте с 23.05.2005
Offline
61
#8
же для случая с висящими страницами надо еще обдумать

а они конкретно влияют на формулы? (я имею ввиду то что лучше от них избавляться? или это только теория?)

wolf, согласен - ступил, но если проект делается грамотно - таких страниц не должно быть (исключение версия для печати- хотя у меня тогда на все страницы есть по висящей) :(

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий