про PR

wolf
На сайте с 13.03.2001
Offline
1183
#291
Людкевич, ты похоже запутался немного в формулах и авторах.

Да нет, я так не думаю. Кстати, ты так и не ответил на мои возражения по поводу индикации PR в тулбаре. Хотелось бы что-нибудь от тебя услышать по этому поводу.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
euhenio
На сайте с 21.09.2001
Offline
357
#292

Казак, вот ты в который раз не отвечаешь на вопрос про "малоценные ссылки". Ты писал:

По мнению большинства: Toolbar PR = int (ЗК); по моему мнению, там идет дополнительно предварительная отсечка малоценных ссулок.

-дело в том, что эта оговорка про малоценные ссылки во многих случаях дала бы тебе возможность оправдываться. Но я этого не хочу допустить :)

Ладно, не хочешь отвечать - не надо. Поработаем с тем, что есть.

Расчеты, приведенные ниже, делаются на основе шкалы Казака - округлении PR до десятых долей, предполагая, что PR всегда <1:

_____________

Рассмотрим приснопамятный Cossack's web, и именно раздел Web design:

PRtoolbar=6/10 http://www.cossack.org.uk/web_design/

С нее мы видим 17 ссылок на пункты меню, и 12 ссылок на статьи.

Возьмем одну из статей, не из начала, чтобы она не попала в анонсы на главной, например авторскую "статью" Web Site Templates, написанную 23 сентября:

PR=5/10, http://www.cossack.org.uk/web_design/publication34

__________

Начинаем считать.

Поскольку для оченьнизкоцитируемой, но проиндексированной Гуглем страницы PRtoolbar=0/10, делаем вывод, что (1-d)<0.1 -- это для ориентировки, хотя это и не сильно важно.

(1-d - это по формуле минимальный ПР, который имеет страница).

Что у нас для http://www.cossack.org.uk/web_design/ ?

PR=0.55 - 0.6499, пусть по максимуму 0.65

Ссылок 29-30, но 17 из них из меню - повторяются на всех страницах, а уникальных, возьмем по минимуму - 10 (это ссылки на статьи).

Зачем я беру максимальный ПР и минимальное количество сслыок в расчете? Затем, чтобы частное от деления PR/(число ссылок) получилось максимальным.

А теперь посчитаем, какой должен быть ПР на одной из десяти страниц-статей, на каждую из которых есть одна ссылка с этого раздела:

PR=(1-d)+d*0.65/10 = (1-d)+d*0.065

Т.е., этот ПР лежит в пределах от 0 до 0.16499 по-любому, т.е. МАКСИМАЛЬНЫЙ ПР после округления = 2/10

Однако, для http://www.cossack.org.uk/web_design/publication34

ПР=от 0.45 до 0.5499, что в любом случае больше, чем рассчитанное значение по шкале Казака и линейной модели.

Т.е, даже при максимальном d=1 все равно этот ПР=0.45 не достигается!

_____________

Вывод: линейная шкала (которую использует Казак) - говно. Ибо не описывает экпериментальные данные.

И расчеты, которые Казак делает на основе этой шкалы - сами понимаете... :) Вообще - то, на эти расчеты Казак только намекает, но никогда их не показывает...

___

ЗЫ Если работать с числами PR не 0.6-0.5, а 6-5, - получится то же самое. :)

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
C
На сайте с 17.08.2002
Offline
82
#293
Как писал euhenio
Поскольку для очень низкоцитируемой, но проиндексированной Гуглем страницы PRtoolbar=0/10, делаем вывод, что (1-d)<0.1
...
А теперь посчитаем, какой должен быть ПР на одной из десяти страниц-статей, на каждую из которых есть одна ссылка с этого раздела:
PR=(1-d)+d*0.65/10 = (1-d)+d*0.065
Т.е., этот ПР лежит в пределах от 0 до 0.16499 по-любому, т.е. МАКСИМАЛЬНЫЙ ПР после округления = 2/10
...
Т.е, даже при максимальном d=1 все равно этот ПР=0.45 не достигается!

Казак уже наверное замучался всем повторять, что d для разных страниц разный. Т.е. никакие оценки для d на его странице через d страниц с PR(bar)=0 не годятся.

PR по твоей формуле, euhenio, изменяется от 0,065 до 1.

Кстати PR=0,5325 при d=0.5

Как писал euhenio
Вывод: линейная шкала (которую использует Казак) - говно. Ибо не описывает экпериментальные данные.
И расчеты, которые Казак делает на основе этой шкалы - сами понимаете... :)

Так что все твои расчеты _ничего_ не доказывают. И не смотря на то, что я не согласен Казаком, что d разный, или что шкала линейная, я считаю, что у него достаточно стройная теория, которую не так-то легко опровергнуть ;)

wolf
На сайте с 13.03.2001
Offline
1183
#294
Казак уже наверное замучался всем повторять, что d для разных страниц разный.

Кстати, а откуда он это взял? Ни у кого из отцов-основателей и их проследователей (даже самых смелых :)) я и намёка не нашел на то, что d может быть разный, во всех формулах - это скаляр, а никак не вектор. Вот даже про векторный PR в той же статье "Topic-Sensitive PageRank" встречал, но никак не про d...

A
На сайте с 20.12.2003
Offline
11
#295

ну рядом стоящие PR5-PR6 можно линеаризировать с некоторой ошибкой которую можно уменьшить подобрав d. Надо бы пример скажем страницы с PR5 которая ЗАРАБОТАЛА свой PR за счет ссылок от страниц с PR0..3

То есть через ступень, тогда линеаризировать будет труднее. Похоже что в случае если в расчетах участвую только страницы с PRN и N+1 линейная модель может быть подогнана с помощью d под любой мыслимый вариант. Для опровержения линейной модели этом случае надо делать расчеты над группами однотипных страниц...тогда вариативность d было бы крайне трудно объяснить (страницы одной тематики и одного PR то d=const).

---

Конечно в реале вероятность ухода визитера для разных страниц разная и наверное и от времени суток зависит :-)

Cage в данном случае уже зная PR-ы страниц показал возможность подогнать d...но откуда тогда гугл узнает эти разные d для разных страниц до вычисления их PR?

---

to Cage:

Т.е. никакие оценки для d на его странице через d страниц с PR(bar)=0 не годятся.

А почему собственно? Была страница с PR0, d=0.8 - поставили на нее линк с PR6, получили что страница с PR5, и что теперь у нее и d изменится? с какой стати? (content=const конечно) - то есть d не зависит от PR страницы.

euhenio
На сайте с 21.09.2001
Offline
357
#296

Cage,

Казак уже наверное замучался всем повторять, что d для разных страниц разный. Т.е. никакие оценки для d на его странице через d страниц с PR(bar)=0 не годятся.

-то, что утверждал Казак - это что есть 2 типа страниц (хабы и ауторити), для которых используются разные d!

d - в данном случае ты используешь как способ подгонки! :) А на самом-то деле это осмысленный параметр. Ты, установив d "близким к нулю", фактически приравниваешь PR страницы к PR Гугля. Это как, нравится тебе? :)

Если уж ты говоришь "за различные d", проследи его связь с качеством страницы тогда. d=0 => PR=1 - самый большой ПР. Но d=0 означал бы по уму чрезвычайно низкое качество страницы.

Поэтому я здесь изменяю d в некоторых пределах, оцененных выше в единицах ПР (1-d)<0.1. Заметь, даже Казак против этого пока не возражал (может, првда, не успел? :))

Понимаешь, дело в том что шкала линейная, как у Казака, еще и не учитывает того, что d/(N) делится на число страниц.

А теорией я бы это не назвал. :) Отмазка это.

PR по твоей формуле, euhenio, изменяется от 0,065 до 1.

-пределы изменения d.

M
На сайте с 12.01.2003
Offline
130
#297

euhenio, wolf. Ну у меня лично уже сил нет смотреть как вы мучаетесь. Ну просто есть близкие и постоянно наблюдаемые вещи которые, тем не менее, не могут быть нами изменены. Ежедневный восход солнца, отношения мужчины и женщины, точка росы при определенных условиях, сломаная дверь морга первой Градской... ну вы можете дополнить в этот список мнение Cossack'а.

В написаном уже достаточно ссылок и достаточно рассчетов. Тот кто не сможет определиться со своим мнением по уже зафиксированной части дискуссии, ну и... бог с ним. Такого человека мучать продолжением не надо.

A
На сайте с 20.12.2003
Offline
11
#298

почему же - очень интересно! всплывают новые детали... приводятся более точные расчеты...

Cossack
На сайте с 17.12.2002
Offline
279
#299
wolf: Кстати, ты так и не ответил на мои возражения по поводу индикации PR

Про логарифмы? Хо-хо... Не смешите меня. Может вам стоит начать со свойств логарифмов? Шкала показана в Toolbar, она может соотносится с расчетными данными либо с округлением, либо с отсечкой и округлением. Кстати, формулы ты взял из 2-х разных источников, а ссылку дал на третий ;). Про то как ты там передернул - даже не хочется говорить... Ну перепутал человек, ну с кем не бывает во время праздников. Там просто слагаемые переставлены местами, видимо оно и смутило тебя. Там d или его аналог не делятся ни на что. Этот фактор действительно определят многое, и у Брина дано определение его смысла ;).

euhenio: ...дело в том, что эта оговорка про малоценные ссылки во многих случаях дала бы тебе возможность оправдываться.

Меня интересует не правильность моего мнения, а возможность получить ответ, близкий к истинному ;). Ты это знаешь ;).

По расчетам: ты что считаешь, euhenio?

На Web Site Templates ведет только одна ссылка с Web Design, значит берем и расчитываем по ней [на основе The Anatomy of a Large-Scale...]:

.54 = 1 - d + d*(.64/28)

.54 = 1 - d + d*(.55/28)

.45 = 1 - d + d*(.64/28)

.45 = 1 - d + d*(.55/28)

Так верно? d подсчитать можешь? Оно в заданных пределах? Попробуем более сложный пример?

Прощание славянки... (http://www.youtube.com/watch?v=0xf9lFMWfKw)
wolf
На сайте с 13.03.2001
Offline
1183
#300
wolf: Кстати, ты так и не ответил на мои возражения по поводу индикации PR

Про логарифмы? Хо-хо... Не смешите меня.

Никто не собирается тебя смешить. Не про логарифмы. Я имею в виду вот эти два возражения:


Возражение 1.
Получается, что не выполняется условие, что сумма PR всех документов равна 1. Как ты это объяснишь, Акис? На это условие просто забили?

Возражение 2.
По твоему, получается, что PR, положим, морды Яндекса всего лишь менее чем в четыре (!) раза больше PR, к примеру, вот такого вот шедевра веб-строительства: http://unidentified.narod.ru/ Не слишком ли большая плотность результатов?

Хотелось бы получить ответы по обоим пунктам.

Кстати, формулы ты взял из 2-х разных источников, а ссылку дал на третий

Разные нотации одной и той же формулы сути дела не меняют.

Там просто слагаемые переставлены местами, видимо оно и смутило тебя.

Ты думаешь, подобные вещи могут смутить дипломированного математика? :)

Там d или его аналог не делятся ни на что.

Делится. ибо чтобы выполнялось условие единичной суммы всех PR (а это условие есть! Только кто-то о нём упорно забывает), оно просто обязано делиться, вернее, выражаясь более корректно, к свободному члену в каждом уравнении системы должен добавляться множитель 1/N, где N - число уравнений в системе или же количество рассматриваемых документов. Это можно легко показать, проведя ряд несложных манипуляций с уравнениями в системе. Попрактикуйся на досуге. Когда же Брин с Пейджем рассматривают для примера одно уравнение в своей обзорной статье "The Anatomy...", то N=1, и соответственно, они этим множителем пренебрегли. В более серьёзной статье "The PageRank Citation Ranking..." они уже используют матричную форму записи и возникает упоминание о некоем важном векторе E как множителе при свободном члене, однако его значение не конкретизируется. У Хавеливалы в эго ретроспективном обзоре классического алгоритма PageRank используется тоже матричная форма записи системы, но множитель уже конкретизируется как Nx1 вектор p=[1/N]. Неужно ты думаешь, что Хавеливала это нарочно придумал, преследуя какие-то свои цели? То что он начал сам придумывать, начинается с пункта 3 его статьи.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий