про PR

Cossack
На сайте с 17.12.2002
Offline
279
#191
Во-во, в этом-то "не совсем точно" и кроется то, что ты никак не хочешь понять.

Смертным оно недоступно, да и не так важно оно - 0.05 - нормальная точность [платите же вы за электичество с такой погрешностью ;)], особенно учитывая "накачку" ссылок форумами, гестбуками и фармами ;)...

Хорошо, если нет нормализации, то объясни мне, что означает PR=10/10? Единицу? Т.е. вероятность нахождения юзера на этой странице в любой момент времени равна 100%?

Вот она разница между математикой и теорией вероятности - событие может случится, но оно не случилось ;), пока ты туда не пошел на страницу, а когда ты зашел на нее, то там 1 по-любому ;). Собственно тут чистый betting в моем понимании - посмотри ставки тотализаторов, там бывает такое:

04 Dec 2003 - Thurles - 3:30 - Rosenca - F - 11/10, а бывает и 16/15 ;).

То есть результат практически гарантирован ;), вот о подобном я и говорил, когда упоминал "скромность" Google, при их 60-80 % ставить себе 10/10 - проблематично, и дико амбициозно - но это не имеет отношения к расчету PR ;).

Реального опыта тебе не хватает, судя по всему, чтобы осознать всё это.

(R))))) Это не связано с расчетами, а с политикой компании Google. Фактически речь идет о девальвации PR, но поскольку расчет скорее всего идет с головы - девальвируются ранги для всех сайтов ;).

Шкала, как и нормализация - от лукавого, давайте будем проще - разные d и сумма [качества] ссылок со станиц (выраження как отношение их рангов к количествы ссылок).

Comments: Речь идет о распределении вероятности случайных событий и вполне нормально иметь 1, как ограничение, поскольку одновременный выбор 2-х страниц пока не предусмотрен нашим компьютером [мозгом ;)].

Прощание славянки... (http://www.youtube.com/watch?v=0xf9lFMWfKw)
A
На сайте с 20.12.2003
Offline
11
#192

Допустим вы подбрасываете монетку, выпадает орел и вы говорите вероятность выпаедния орла равна 1. Два бала, перездавать теорвер :-)

Cossack
На сайте с 17.12.2002
Offline
279
#193
Допустим вы подбрасываете монетку, выпадает орел и вы говорите вероятность выпаедния орла равна 1.

???

После события оценка его вероятности бессмысленна, оно уже произошло ;).

A
На сайте с 20.12.2003
Offline
11
#194

Коллеги! очень итересная дискуссия! спасибо!

Простите дилетанта, но прочитав сотни сообщений и прочитав почти все статьи которые все тут знают все же не понял - PR это оценка топологии, связи страниц через ссылки или же все же чистая вероятность, но тогда вероятность какого события? У меня как дилетанта сложилось впечатление что вероятность появилась в рассужлениях тут присутствующих из-за того что сумма неких величин имеющих некое отношения к страницам равна 1 - об этом в статье отцов гугла. Ну а если бы норма была равна 100? 1000? и тд. Ведь PR все равно вычислялся бы по аналогичным формулам, нормировался и показывался бы как 1..10 в баре и никто бы не заметил бы подмены, но о вероятности бы уже никто не говорил бы?

И еще - на форуме есть стороники втекания и вытекания PR и стороники того что нет никаких потоков а только расчеты. Попробую примирить такой дуализм. Допустим в басейн втекает вода по одной трубе, а по другой вытекает. Уровень воды в басейне назовем PR и будем его вычислять. Тогда PR - это мат. абстракция отражающая реальность. И довольны обе стороны. Одни говорят о реальности где есть потоки, другие об абстрактоной мат величине которая расчитывается. Все по своему правы. Хотя стороники расчетов могут сказать что вода сотсоит из молекул, которые никуда не текут, а просто надо считать их колво.

То есть втекание и вытекание или потоки это тоже мат абстакция хотя и более близкая к реальности. Вспомните например пассажиро-потоки и тд.

А что вы скажете если я вот такой моделью попытаюсь примерить вероятность и топологию...

пусть страницы это бассейны, уровень воды - PR, связи между страницами - спец.трубы (может быть с рзными диаметрами? специфичность таких труб (ссылок) - поток в одну сторону и

другие странности)

Бассейны - открытые, посетители это дождь с неба, идущий (выпадающий) равномерно над всеми бассейнами, капля - один посетитель. Вода из бассенов испаряется, из нее формируются тучи из которых идет дождь. В такой системе через неокторые время вероятно установится равновесие, уровни воды в басейнах стабилизируются, интенсивность испарения воды и выпадения дождя будут в среднем одинаковы, масса воды (или число капель) постоянна.

В принципе можно расчитать уровни во всех бассейнах исходя только из топологии не привлекая понятие вероятности вообще, но если считать массу воды (число капель) константой то отнормировав все к 1 можно воспользоваться аппаратом теорвера, что возможно облегчает расчеты и понимание результатов.

- модель упрощенная, возможно более точно - некоторые сайты (гугл, яхо и тд) собирают больше входного потока, или, другими словами, верятность первичного вхождения в интернет через эти сайты выше. Хотя и ссылок на эти сайты миллионы. То есть косвенно число ссылок на страницу связано со способностью данной страницы привлекать больше первичных вхождений в интернет, чем в среднем. Какая то коррекция есть, но ее вес так с лету мне не вычислить. Число посетителей страницы и число сылок на нее, обе эти величины в какой то мере отражают "интересность" страницы. Чем интересней страница - тем выше обе величины (в установившемся режиме, без учета накруток, оптимизаций и насилия по типу дефолтного поиска в ms ie)

Таким образом PR это абстрактная мат величина, ближайший (но не точный) "физический" смысл которой, среднее число посетителей данной страницы за сутки.

P.S. теоретически гугл через свой бар может оценивать число посетителей на страницах, и возможно подгоняет коэф. в ф-лах расчета PR так чтобы реальные измерения баром как-то коррелировали с PR.

Хе-хе, если бы у всех стоял бар и не было бы накрутчиков и хакеров,

да и если бы не было страниц с низкой посещаемостью...то бара было бы достаточно.

P.P.S. из моей модели понятно что шкала 1..10 нормирована, PR=10 это логарифм (или подобная ф-ия) от числа посетителей самой посещаемой страницы. Также понятнo почему (PR3 vs PR4) и (PR7 vs PR8) это "две большие разницы". В первом случае разница в числе ТЕОРЕТИЧЕСКИХ посетителей сотни, во втором сотни тысяч. Сама нормировка связана с конечным разрешением экрана и зрения человека и тем что мало страниц с большим кол-вом посетителей и миллионы с малым, с возможностями графического индикатора, ну и защитой от оптимизаторов.

(хотя без учета "вредных" факторов число теор и реальных посетителей должно хорошо коррелировать) - Физический смысл более высокой ценности ссылки со страницы с более высоким PR можно в рамках моей модели объяснить тем, что из-за кореляции PR и реального числа посетителей страницы ссылка на сранице в высоким PR будет показана большему числу посетителй и страница на которую ведет такая ссылка получит больше целевых посетителей. Наблюдения вроде бы подтверждают это. Если PR некоей страницы высок и получен без "оптимизаций" то если удается получить ссылку с такой страницы, то, как правило, получаешь неплохой поток целевых "хороших" покупкоспособных посетителей. Ну много и исключений из "правила", хотя и PR таких страниц сомнителен...во всяком случае не очевидны для меня пути его получения так как контент убогий и тд...

Cossack
На сайте с 17.12.2002
Offline
279
#195

1) ПР прямо не связан с числом посетителей на странице, наоборот - число посетителей практически прямо зависит от качества ссылок на страницу ;).

2) Норма ссылок за долю вероятности - имеет что-то близкое к смыслу только при наличии одинаковых страниц и ссылок с них - такого нет и говорить 1000 за 1 или че там... можно только чисто теоретически.

3) Про потоки ни слова, с ними просто клиника ;).

PR это оценка топологии, связей между страницами...

по тематике, иерархии, секторам...

A
На сайте с 20.12.2003
Offline
11
#196

В вольном переводе отцы гугла смысл PR определили как относительную важность страницы для поиска, серфинга и оценки трафика(!) этой страницы. Расчет ведется на основе топологии веба.

http://dbpubs.stanford.edu:8090/pub/showDoc.Fulltext?lang=en&doc=1999-66&format=pdf&compression=

Кол-во ссылок и кол-во посетителей зависит от "важности" страницы.

Этот постулат в основе PR.

Не только по ссылкам с других страниц.

Посетители важные страницы такие как гугл делают своей стартовой страницей. Или набирают руками в URL. Безусловно важные страницы со временм набирают много ссылок и доп число посетителй. Но первично все же "важность". Ну так во всяком случае думают сами отцы гугла.

То есть причиной появления на страницы посетителй и появления ссылок на страницу является ее "важность" для людей, а не наоборот. В установившемся устаканевшемся режиме это не ясно, поэтомк читаю первоисточник (ссылка выше)

Cossack
На сайте с 17.12.2002
Offline
279
#197
и оценки трафика(!) этой страницы

Google не может оценивать то, что не видит, а именно: логи и заходы с других поисковиков, а вот про переходы с Google - у нас уже был разговор ;). Большой брат не спит.

greenwood
На сайте с 08.09.2003
Offline
519
#198
Число посетителей страницы и число сылок на нее, обе эти величины в какой то мере отражают "интересность" страницы

Если я правильно понял,то PR зависит от колличества тонких и толстых труб прикрученных к бассейну (сайту,странице),но счётчики воды на трубы слесарь (Гугль) не поставил.Если это так,то по логике..слесарь может думать,что он знает сколько воды (полезности ресурса)в бассейнах

исходя только из диаметра входящих и исходящих труб ?

A
На сайте с 20.12.2003
Offline
11
#199

Гугл видит топологию, видит число ссылок на страницу, число ссылок (взвешенное)есть мера важности страницы или PR. Важные страницы имеют много посетителей (без учета оптимизаторов-накрутчиков и тд). Также ваше "число посетителей практически прямо зависит от качества ссылок на страницу" - думаю вы не будете отрицать и зависимость от кол-ва ссылок некоторого качества. Ну что-то типа N = качество1*колво1 + качество2*колво2 и тд

A
На сайте с 20.12.2003
Offline
11
#200

Счетчики на трубах есть. Это сама страница гугла, бар, адворд - трэкинг (там вешается по доброй воле конечно картинка!) В принципе статистически достаточно мне кажется. Гугл по моей теории предполагает стандартность труб среднем. Достаточно оценить трубы к google.com и подкорректировать баром и распространить на весь веб, точность будет видмо очень неплоха. Возможно диаметр трубы неудачно. Пусть диаметр одинаков - поток посетителей через трубу(ссылку) зависит от уровня (PR) воды в бассейне, чем выше уровень, тем выше давление, тем мощнее поток. Ну я не настаиваю на абсолюной точности аналогии с водой и басейнами, но трактовка физ. смысла - кажется удачной, туман значительно расеивается, отпадают вопросы с нормировкой и вероятностями большими единицы.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий