antimanyak

Рейтинг
11
Регистрация
20.12.2003
Должность
good
Интересы
good
good

судя по расчетам euhgenio (ссылки были в этом форуме) модель бассейна с трубами не совсем адекватна так как реальная вода не потечет из басена с уровнем 4 в бассейн с уровнем 4. А из его расчетов вроде получается что несколько ссылок со страниц с PR4 могут довести PR до 5 если с нее нет обратных ссылок (и вообще нет ссылок вовне). Правильно?

безусловно, оссобено ярко чувствуется это из-за экспоненциальности числа посетителей от PR. То есть ссылка с PR6 при прочих равных условиях по моему скромному опыту дает в 10 раз больше посетителей чем аналогичная в аналогичном месте страницы ссылка со страницы с PR5.

Счетчики на трубах есть. Это сама страница гугла, бар, адворд - трэкинг (там вешается по доброй воле конечно картинка!) В принципе статистически достаточно мне кажется. Гугл по моей теории предполагает стандартность труб среднем. Достаточно оценить трубы к google.com и подкорректировать баром и распространить на весь веб, точность будет видмо очень неплоха. Возможно диаметр трубы неудачно. Пусть диаметр одинаков - поток посетителей через трубу(ссылку) зависит от уровня (PR) воды в бассейне, чем выше уровень, тем выше давление, тем мощнее поток. Ну я не настаиваю на абсолюной точности аналогии с водой и басейнами, но трактовка физ. смысла - кажется удачной, туман значительно расеивается, отпадают вопросы с нормировкой и вероятностями большими единицы.

Гугл видит топологию, видит число ссылок на страницу, число ссылок (взвешенное)есть мера важности страницы или PR. Важные страницы имеют много посетителей (без учета оптимизаторов-накрутчиков и тд). Также ваше "число посетителей практически прямо зависит от качества ссылок на страницу" - думаю вы не будете отрицать и зависимость от кол-ва ссылок некоторого качества. Ну что-то типа N = качество1*колво1 + качество2*колво2 и тд

В вольном переводе отцы гугла смысл PR определили как относительную важность страницы для поиска, серфинга и оценки трафика(!) этой страницы. Расчет ведется на основе топологии веба.

http://dbpubs.stanford.edu:8090/pub/showDoc.Fulltext?lang=en&doc=1999-66&format=pdf&compression=

Кол-во ссылок и кол-во посетителей зависит от "важности" страницы.

Этот постулат в основе PR.

Не только по ссылкам с других страниц.

Посетители важные страницы такие как гугл делают своей стартовой страницей. Или набирают руками в URL. Безусловно важные страницы со временм набирают много ссылок и доп число посетителй. Но первично все же "важность". Ну так во всяком случае думают сами отцы гугла.

То есть причиной появления на страницы посетителй и появления ссылок на страницу является ее "важность" для людей, а не наоборот. В установившемся устаканевшемся режиме это не ясно, поэтомк читаю первоисточник (ссылка выше)

А может быть если каталог качественный контент имеет, то появятся внешние ссылки на него, а не на главную страницу и глядишь он догонит главную страницу и будет ее еще и подпитывать пэ-эром?

Коллеги! очень итересная дискуссия! спасибо!

Простите дилетанта, но прочитав сотни сообщений и прочитав почти все статьи которые все тут знают все же не понял - PR это оценка топологии, связи страниц через ссылки или же все же чистая вероятность, но тогда вероятность какого события? У меня как дилетанта сложилось впечатление что вероятность появилась в рассужлениях тут присутствующих из-за того что сумма неких величин имеющих некое отношения к страницам равна 1 - об этом в статье отцов гугла. Ну а если бы норма была равна 100? 1000? и тд. Ведь PR все равно вычислялся бы по аналогичным формулам, нормировался и показывался бы как 1..10 в баре и никто бы не заметил бы подмены, но о вероятности бы уже никто не говорил бы?

И еще - на форуме есть стороники втекания и вытекания PR и стороники того что нет никаких потоков а только расчеты. Попробую примирить такой дуализм. Допустим в басейн втекает вода по одной трубе, а по другой вытекает. Уровень воды в басейне назовем PR и будем его вычислять. Тогда PR - это мат. абстракция отражающая реальность. И довольны обе стороны. Одни говорят о реальности где есть потоки, другие об абстрактоной мат величине которая расчитывается. Все по своему правы. Хотя стороники расчетов могут сказать что вода сотсоит из молекул, которые никуда не текут, а просто надо считать их колво.

То есть втекание и вытекание или потоки это тоже мат абстакция хотя и более близкая к реальности. Вспомните например пассажиро-потоки и тд.

А что вы скажете если я вот такой моделью попытаюсь примерить вероятность и топологию...

пусть страницы это бассейны, уровень воды - PR, связи между страницами - спец.трубы (может быть с рзными диаметрами? специфичность таких труб (ссылок) - поток в одну сторону и

другие странности)

Бассейны - открытые, посетители это дождь с неба, идущий (выпадающий) равномерно над всеми бассейнами, капля - один посетитель. Вода из бассенов испаряется, из нее формируются тучи из которых идет дождь. В такой системе через неокторые время вероятно установится равновесие, уровни воды в басейнах стабилизируются, интенсивность испарения воды и выпадения дождя будут в среднем одинаковы, масса воды (или число капель) постоянна.

В принципе можно расчитать уровни во всех бассейнах исходя только из топологии не привлекая понятие вероятности вообще, но если считать массу воды (число капель) константой то отнормировав все к 1 можно воспользоваться аппаратом теорвера, что возможно облегчает расчеты и понимание результатов.

- модель упрощенная, возможно более точно - некоторые сайты (гугл, яхо и тд) собирают больше входного потока, или, другими словами, верятность первичного вхождения в интернет через эти сайты выше. Хотя и ссылок на эти сайты миллионы. То есть косвенно число ссылок на страницу связано со способностью данной страницы привлекать больше первичных вхождений в интернет, чем в среднем. Какая то коррекция есть, но ее вес так с лету мне не вычислить. Число посетителей страницы и число сылок на нее, обе эти величины в какой то мере отражают "интересность" страницы. Чем интересней страница - тем выше обе величины (в установившемся режиме, без учета накруток, оптимизаций и насилия по типу дефолтного поиска в ms ie)

Таким образом PR это абстрактная мат величина, ближайший (но не точный) "физический" смысл которой, среднее число посетителей данной страницы за сутки.

P.S. теоретически гугл через свой бар может оценивать число посетителей на страницах, и возможно подгоняет коэф. в ф-лах расчета PR так чтобы реальные измерения баром как-то коррелировали с PR.

Хе-хе, если бы у всех стоял бар и не было бы накрутчиков и хакеров,

да и если бы не было страниц с низкой посещаемостью...то бара было бы достаточно.

P.P.S. из моей модели понятно что шкала 1..10 нормирована, PR=10 это логарифм (или подобная ф-ия) от числа посетителей самой посещаемой страницы. Также понятнo почему (PR3 vs PR4) и (PR7 vs PR8) это "две большие разницы". В первом случае разница в числе ТЕОРЕТИЧЕСКИХ посетителей сотни, во втором сотни тысяч. Сама нормировка связана с конечным разрешением экрана и зрения человека и тем что мало страниц с большим кол-вом посетителей и миллионы с малым, с возможностями графического индикатора, ну и защитой от оптимизаторов.

(хотя без учета "вредных" факторов число теор и реальных посетителей должно хорошо коррелировать) - Физический смысл более высокой ценности ссылки со страницы с более высоким PR можно в рамках моей модели объяснить тем, что из-за кореляции PR и реального числа посетителей страницы ссылка на сранице в высоким PR будет показана большему числу посетителй и страница на которую ведет такая ссылка получит больше целевых посетителей. Наблюдения вроде бы подтверждают это. Если PR некоей страницы высок и получен без "оптимизаций" то если удается получить ссылку с такой страницы, то, как правило, получаешь неплохой поток целевых "хороших" покупкоспособных посетителей. Ну много и исключений из "правила", хотя и PR таких страниц сомнителен...во всяком случае не очевидны для меня пути его получения так как контент убогий и тд...

Допустим вы подбрасываете монетку, выпадает орел и вы говорите вероятность выпаедния орла равна 1. Два бала, перездавать теорвер :-)

кстати, прочитав специально многое из того что в этом форуме писал cossack пришел к выводу, что как математик он близок к нулю и иногда произносит вещи простительные только гуманитарию, так что ссылться на него как на авторитет по математике PR... х-м-м-м... более интерсно читать на этом форуме про потоки распределения PR, и еще основная статья на которую многие ссылаются в этом форуме по расчету PR возможно (конечно) не 100% адекватная реальному алгоритму тем не менее во вмногом адекватна реальности, то есть утечка и приток PR в явном виде объяснена математически. Хорошая статья... действительно рекомендую как и многие тут.

А с чего вдруг PR в баре считается 1..10 - там что 10 пикселов в линейке?! А вот и нет! Посчитайте сами! Делается принт скрин копи пасте в пэйин и считается! А на самом деле там... вот есть некие проги шароварные в том числе и наших соотечественников которые дизамблерили бар и точно знают какие значения приходят с сервера... А то 1..10 зациклились... Вот только парней этих не видать в этом форуме, а жаль.

Всего: 92