antimanyak

Рейтинг
11
Регистрация
20.12.2003
Должность
good
Интересы
good
good

а вот такой вопрос - могут ли ссылки со страниц с PR=N на некую страницу дать ей PR=N+1 ? и сколько страниц с PR=N нужно (для простоты пусть на них только одна ссылка только на ту страницу которой мы пытаемся поднять PR до N+1)

Итого: физический смысл PR - число посетителей на странице за некое время, абстрактная математическая трактовка PR (одна из) - вероятность попадания визитера на страницу. Постановка внешних ссылок привотик к утечке посетителей, что должно (при адекватности PR действительности) приводить к "утечке" PR. Простейшие расчеты вроде бы это подтверждают (при условии SUM PRreal(i) = 1)

То есть происходит учечка реальных посетителей, а PR всего лишь индицирует этот процесс. Однако на практике по гугл-бару величину утечки в 99.99% не определить из-за малости ее абсолютной величины, то есть в первом приближении можно считать что утечки нет. :-)

А как будем разбираться на ограниченном наборе страниц, скажем двух-трех или сразу глобальнo? (глобально боюсь не хватит мне квалификации)

ну это место для новичков так что прошу сильно не ругать...

есть две страницы, PR=0.5, PR=0.5, sum=1

есть только одна ссылка с одной на другую.

делаем только одну итерацию. d=0.5 для простоты

PR1=0.5+ 0.5*0.5=0.75

sum=0.5 + 0.75=1.25;

Нормируем к 1

PR2=0.5/1.25=0.4

PR1=0.75/1.25=0.6

Проверяем рузультаты нормировки sum=0.4+0.6=1

Итого - произошла утечка PR2 на 0.1

Где ошибка?

http://www.linking101.com/articles/PageRank.pdf

Это примерно та что я имел ввиду, но там тоже что-то с ф-ми не совсем, хотя они и сходятся но больше 1 возрастает, нет нормировки почему то, код эксела не приведен...

Ну кратко, в статьях что тут были и в вычислениях, что в форуме приводил то ли eugenio, то ли greenwood не было нормировки,

то есть либо процесс вычисления вообще не сходился либо сумма всех PR росла! Но если нормировку все же провести то и получится что PR страниц может не только расти при постановке линков на другие страницы но и падать!!! вот такой парадокс из-за SUM=1

А-у-у! Есть тут математики?! прав я или нет?!

to stabuev - слушай а почему у полумесяца иудейская звезда? так и надо? :-) ну ладно я не спец...

PR действительно у тебя отбирается но это не видно так как отбор очень мал, миллионные доли видимо PR из-за глобальной нормировки. А вот если перейти на житейский смысл - ссылка на странице отбирает у тебя посетителей, то есть утекает поток посетителей. Вот такой пример - на странице всего две ссылки - buy now и ссылка куда то там вовне. В худшем случае ты потеряешь половину потока посетителей покупателей! А мера этой потери PR твоей страницы - без учета накруток и оптимизаций PR это мера числа посетителей твоей страницы. То есть чем больше твой PR тем больше у тебя потери в случае наличия ссылки вовне на твоей странице. Ну примерно так.

с учетом наличия гугла это еще может усугубится - ты поставил ссылку на страницу конкурента, в результате его PR немного возрос и он стал выше в результатах выдачи чем твоя страница и потоки посетителей с гугла перераспределились в его пользу. Если страница конкурента нормальная он начнет получать честные ссылки, PR его станет еще больше и тд.

ссылки на статьи не помню, но они тут на форуме, давали их вроде бы eugenio и greenwood

вообще в статье отцов вероятность и марковские процессы идут в параграфе "доступные и наглядные интерпретации PR" :-)

Ну то есть типа если никаки не понять что такое ссылки, ну так уж и быть вот вам совсем элементарное объяснение - марковсий процесс.. и понеслась...

то есть вероятность привлекается для "наглядного" толкования PR, отсюда и проблемы с < или > 1, все же реальная основа это топология и немного вероятности (d), а не наоборот.

То есть попытки все объяснить на основе вероятности постоянно будут натыкаться на проблемы.

По смыслу улучшение "топологического" места (т.е. PR) своей страницы отбирает посетителей у других страниц. То есть отбирается не PR и не вероятность, а реальные посетители, за которых и идет реальная борьба, "утекает" не PR, а потоки посетителй, а PR это индицирует. Эти процессы происходили бы даже если бы гугла не было бы вообще.

Но он есть и сам оказывает активное воздейсвие на распределение потоков и опосредованно влияет на формирование PR страниц.

Позволю себе порезонерствовать: аналогичная ситуация в квантовой механике - наблюдатель влияет на результат наблюдений!! (гугл - "квантовый" наблюдатель)

>>широко обсуждаемый кодекс оптимизатора

а китайцы участвуют в обсуждении?! :-)

Как писал Cage
Не очень понятно, зачем вообще нужны какие-то аналогии.
Вроде все и так понятно:

Сайтов с низким PR гораздо больше, чем сайтов с высоким PR, поэтому, если бы PR на баре распределялся равномерно (линейно), получилось бы так, что у сайтов с PR(bar) от 1 до 4, например, был бы PR=1. Т.е. пользователи не могли бы оценить разницу в PR между большинством сайтов.

позвольте придраться! х-м-м-м... немного пофлеймить...ну не могу удержаться когда видимо гуманитарий (ничего личного) рассуждает "математически"!

Пусть сайтов с PR=1 500000000000 а сайтов с PR=4 4000000, все равно

их очень легко будет различить на баре, так как 1 заметно отличается от 4 :-)

Дело в том что PR-real это по смыслу число посетителей в сутки на странице, есть страницы с 1 посетителем и не вашно как их много и есть страницы с 1000000 посетителей в сутки и не важно сколько таких страниц, так вот на граф бар длиной скажем в 100 пикселей отобразить PR-real и первой и второй страницы можно взяв логарифм (а не экспоненту! :-) от PR-real (ну и домн на некий коеф и тд)

нет, именно отобрать! смотри, пусть у тебя 0.5 руб и у меня 0.5 руб, путем некоторой оптимизации моего кармана я "ЗАРАБОТАЛ" у тебя 0.5 руб, и теперь у меня 1 руб, а у тебя 0, сумма = 1.

Так что давайте без лицемерия :-) - увеличить свой PR в условиях нормировки это означает отобрать его у других страниц.

Кстати в оригинале статьи отцов гугла нет кристальной ясности

по поводу нормировки - там вообще упоминается константа а не 1,

кроме того не ясно, она константа навсегда или только на период

одного блока циклов итераций до схождения результатов...

to cage, х-м-м-м... если сумма PR=1 то увеличить PR своей страницы можно только отобрав его у других страниц??????

to stabuev, не надо искать очень точного соответсвия. Хотя то что вы пишите прямо как озарение, прямо в точку! :-) Я пытался ПОНЯТЬ физическую основу математики PR, откуда там вероятность, в чем ее смысл, откуда берутся посетители, почему нечто = 1 (const), почему PR3 vs PR4 "слабее" PR5 vs PR6, зачем нормировка. Первоначально d я понимал как испарение воды в бассейнах.

Всего: 92