euhenio

euhenio
Рейтинг
357
Регистрация
21.09.2001
Должность
ИП: продвижение и создание сайтов, увеличение конверсии

<font face="Verdana" size="2">Originally posted by paul:

А те, у кого большой PR, будут ставить ссылки только на тех, у кого PR не меньше- вот мы и докатились до разделения сайтов по PR-ому признаку.

Из-за этого в нормальном мире частенько возникают революции, так что все-таки есть изъян у этого PR, есть, поскольку он поощеряет неравенство и эгоизм сайтов по ссылкам.
</font>

Ну да. Представим себе- есть 2 больших группы сайтов, в каждой из которых ставят ссылки на "своих" и очень мало- на "чужих". По случаю, одна из групп имеет больший ПР (мне кажется, большая числом группа), тогда их противники- имеют малый. В рез-те, произойдет поглощение (когда плохие осознают и изменятся), и группы сольются, но только для этого потребуется изменение качества "плохих" ресурсов.

Мне кажется, все методы войны за ПР между группами основаны только на числе сайтов(страниц) в каждой группе. В том смысле, что это "совковая" демократия - нас больше, поэтому мы правы. А ведь меньшая группа сайтов может быть лучшей! (это как раз "патриции", а большая группа - "плебс")

Так мне кажется, ситуация обратная. Те, кого много, захватили власть (или захватят, если осознают, что ссылки ставить надо только на своих). Как по римским представлениям все гос. системы ухудшаются: монархия-&gt;тирания-&gt;аристократия-&gt;олигархия-&gt;демократия-&gt;охлократия(власть толпы).

Изъян, неизбежный - (при выборе главной из 2-х групп) - неучет реальной посещаемости. Может, есть наработки, как ее учесть при расстановке ПР?

Поскольку при обмене ссылками ПР 2-х сайтов как бы "уравнивается", получается, что любой вебмастер во власти тех, на кого он ссылается.

Может быть, методика расчета ПР, если ее понимать как руководство к действию, должна привести к тому, что с "хороших"(ПР~1) ресурсов люди будут ставить ссылки только на подобные себе ("хорошие") ресурсы, а не будут меняться ссылками с дерьмовыми сайтами ("типа для увеличения LP"), понимая, что это уменьшит их собственный ПР.

И типа это все улучшит организацию Интернета. Хотя чтобы все стали руководствоваться такими соображениями, много времени пройдет...

Мне не видно изъянов в расчете ПР (которые при правильном применении помогут накрутить его), Только получается, что смысл ПР - не разделение на высоко- и низко- цитируемых, а некий способ выявить принадлежность сайта к группе себеподобных, где ПР по группе будет колебаться не сильно.

[This message has been edited by euhenio (edited 29-10-2001).]

Я предполагаю, что слова "сумма всех PR=1" говорятся только для придания формального смысла PR (=вероятность), и то при конечном выводе, а не во время итераций.

Посуди сам- пусть есть 1000000 страниц, тогда:

1) Начнем с ПР=1, сделаем итерацию, получим ПР ПОРЯДКА 1. Разделим сумму ПР на 1000000, получим ПР порядка 0.000001

2 итерация) Начнем с ПР=0.000001, возьмем сумму по ссылкам, получим тот же порядок

+

Затем учтем d=0.85, получим

ПР~0.15+0.85*(~0.000001)~0.15

Разделим сумму ПР на 1000000, получим ПР порядка 0.00000015

3 итерация) Начнем с ПР=0.00000015, возьмем сумму по ссылкам, получим тот же порядок

+

Затем учтем d=0.85, получим

ПР~0.15+0.85*(~0.00000015)~0.15

Разделим сумму ПР на 1000000, получим ПР порядка 0.00000015-------

при этом ПР определяется РЕАЛЬНО ТОЛЬКО числом 0.15

И так далее.

Математически d нивелирует разницу сайтов в ПР, СДВИГАЯ ПР К 1 !!! Если проводить расчеты так, как ты говоришь, это есть сдвигание нулей к 1, тогда у всех сайтов ПР практически одинаков, на уровне (1-d)/N сайтов.

Мне кажется, ты не пробовал сам это считать. Да, в статье на сайте используется тот же метод. Привести это все к вероятности легко можно после того, как сходимость достигнута. А так сходимости у тебя не будет- то ПР ~0.15, то ~0.00000015

В том-то и фишка. Это же твои личные страницы, любые цепочки делаешь сам. Ну или, твои сайты. Получится кольцо, которое (как видно) дает PR=1.

[This message has been edited by euhenio (edited 26-10-2001).]

PR не может быть делен на число страниц, тк там есть-

PR=(1-d)+d*(Sum), т.е. при каждой итерации PR приближается к 1, dumping и сделан, видимо, для этого. Не сумма PR=1, а =числу страниц, при этом в среднем получится PR=1 по Инету. Это очевидно. Если проводить итерацию N раз, сдвиг к 1 будет слишком велик (от числа, близкого к PR~0=1/N, где N=сайтов в Инете).

Собственно, это и неважно, как считать.

Кроме того, как я понял из описания, d все-таки разные. Если даже и нет, это было бы хорошим улучшением.

Самое главное, неясно, достаточно ли d=0.85 для пресловутой сходимости.... Кто-нибудь знает, как бы это можно посчитать?

Цитата оттуда же-

_________

. And, the d damping factor is the probability at each page the "random surfer" will get bored and request another random page. One important variation is to only add the damping factor d to a single page, or a group of pages. This allows for personalization and can make it nearly impossible to deliberately mislead the system in order to get a higher ranking

_________

2paul-

Эта ссылка уже была http://www7.scu.edu.au/programme/fullpapers/1921/com1921.htm с алгоритмом расчета PR.

______

We assume page A has pages T1...Tn which point to it (i.e., are citations). The parameter d is a damping factor which can be set between 0 and 1. !2AIK- We usually set d to 0.85. There are more details about d in the next section. Also C(A) is defined as the number of links going out of page A. The PageRank of a page A is given as follows:

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

Note that the PageRanks form a probability distribution over web pages, so the sum of all web pages' PageRanks will be one.

________

Конечно, вектор умножается на соб.зн-е, но оно=1 либо нормируется к 1 (1, за счет того, что сумма всех PR / к-во страниц = 1 по определению.). Векторной формулы в явном виде не давали, но если вектор=вероятности по сайтам i, а матрица=к-во ссылок с сайта i на j, это просто формализация алгоритма расчета.

2Aik-

Это как, для каждого сайта выбирать d для сходимости процесса? d, насколько я понял, вероятность того, что юзер закончил на этом сайте (или 1 минус это), и для каждого сайта своя, выбирается априори (м.б, из свойств текста). d фиттить для каждого сайта - немаленькое число свободных переменных.

[This message has been edited by euhenio (edited 26-10-2001).]

Мне кажется, хорошо использовать такой метод- генерить страницу скриптом, который определяет переменную ACCEPT_LANGUAGE, если там есть ru, то выдается русский контент, ну и так далее по всем языкам, если есть желание()... А если ничего не найдено- то основной язык. Яндекс, по крайней мере, ставит ru.

а если несколько страниц под разные языки- то и находиться они будут отдельно. Да, можно и в параметрах указывать язык, при регистрации.

------------------

euhenio

[This message has been edited by euhenio (edited 12-10-2001).]

Не понимаю, какие найденные документы?

просто набираю эту фразу(как быстро раскрутить сайт) на первой странице Яндекса, ответ- "искомая комбинация слов нигде не встречается", проверял сейчас. Настроек вроде не ставил.

------------------

euhenio

Всего: 4720