Ну да. Представим себе- есть 2 больших группы сайтов, в каждой из которых ставят ссылки на "своих" и очень мало- на "чужих". По случаю, одна из групп имеет больший ПР (мне кажется, большая числом группа), тогда их противники- имеют малый. В рез-те, произойдет поглощение (когда плохие осознают и изменятся), и группы сольются, но только для этого потребуется изменение качества "плохих" ресурсов.
Мне кажется, все методы войны за ПР между группами основаны только на числе сайтов(страниц) в каждой группе. В том смысле, что это "совковая" демократия - нас больше, поэтому мы правы. А ведь меньшая группа сайтов может быть лучшей! (это как раз "патриции", а большая группа - "плебс")
Так мне кажется, ситуация обратная. Те, кого много, захватили власть (или захватят, если осознают, что ссылки ставить надо только на своих). Как по римским представлениям все гос. системы ухудшаются: монархия->тирания->аристократия->олигархия->демократия->охлократия(власть толпы).
Изъян, неизбежный - (при выборе главной из 2-х групп) - неучет реальной посещаемости. Может, есть наработки, как ее учесть при расстановке ПР?
Поскольку при обмене ссылками ПР 2-х сайтов как бы "уравнивается", получается, что любой вебмастер во власти тех, на кого он ссылается.
Может быть, методика расчета ПР, если ее понимать как руководство к действию, должна привести к тому, что с "хороших"(ПР~1) ресурсов люди будут ставить ссылки только на подобные себе ("хорошие") ресурсы, а не будут меняться ссылками с дерьмовыми сайтами ("типа для увеличения LP"), понимая, что это уменьшит их собственный ПР.
И типа это все улучшит организацию Интернета. Хотя чтобы все стали руководствоваться такими соображениями, много времени пройдет...
Мне не видно изъянов в расчете ПР (которые при правильном применении помогут накрутить его), Только получается, что смысл ПР - не разделение на высоко- и низко- цитируемых, а некий способ выявить принадлежность сайта к группе себеподобных, где ПР по группе будет колебаться не сильно.
[This message has been edited by euhenio (edited 29-10-2001).]
Я предполагаю, что слова "сумма всех PR=1" говорятся только для придания формального смысла PR (=вероятность), и то при конечном выводе, а не во время итераций.
Посуди сам- пусть есть 1000000 страниц, тогда:
1) Начнем с ПР=1, сделаем итерацию, получим ПР ПОРЯДКА 1. Разделим сумму ПР на 1000000, получим ПР порядка 0.000001
2 итерация) Начнем с ПР=0.000001, возьмем сумму по ссылкам, получим тот же порядок
+
Затем учтем d=0.85, получим
ПР~0.15+0.85*(~0.000001)~0.15
Разделим сумму ПР на 1000000, получим ПР порядка 0.00000015
3 итерация) Начнем с ПР=0.00000015, возьмем сумму по ссылкам, получим тот же порядок
ПР~0.15+0.85*(~0.00000015)~0.15
Разделим сумму ПР на 1000000, получим ПР порядка 0.00000015-------
при этом ПР определяется РЕАЛЬНО ТОЛЬКО числом 0.15
И так далее.
Математически d нивелирует разницу сайтов в ПР, СДВИГАЯ ПР К 1 !!! Если проводить расчеты так, как ты говоришь, это есть сдвигание нулей к 1, тогда у всех сайтов ПР практически одинаков, на уровне (1-d)/N сайтов.
Мне кажется, ты не пробовал сам это считать. Да, в статье на сайте используется тот же метод. Привести это все к вероятности легко можно после того, как сходимость достигнута. А так сходимости у тебя не будет- то ПР ~0.15, то ~0.00000015
В том-то и фишка. Это же твои личные страницы, любые цепочки делаешь сам. Ну или, твои сайты. Получится кольцо, которое (как видно) дает PR=1.
[This message has been edited by euhenio (edited 26-10-2001).]
PR не может быть делен на число страниц, тк там есть-
PR=(1-d)+d*(Sum), т.е. при каждой итерации PR приближается к 1, dumping и сделан, видимо, для этого. Не сумма PR=1, а =числу страниц, при этом в среднем получится PR=1 по Инету. Это очевидно. Если проводить итерацию N раз, сдвиг к 1 будет слишком велик (от числа, близкого к PR~0=1/N, где N=сайтов в Инете).
Собственно, это и неважно, как считать.
Кроме того, как я понял из описания, d все-таки разные. Если даже и нет, это было бы хорошим улучшением.
Самое главное, неясно, достаточно ли d=0.85 для пресловутой сходимости.... Кто-нибудь знает, как бы это можно посчитать?
Цитата оттуда же-
_________
. And, the d damping factor is the probability at each page the "random surfer" will get bored and request another random page. One important variation is to only add the damping factor d to a single page, or a group of pages. This allows for personalization and can make it nearly impossible to deliberately mislead the system in order to get a higher ranking
2paul-
Эта ссылка уже была http://www7.scu.edu.au/programme/fullpapers/1921/com1921.htm с алгоритмом расчета PR.
______
We assume page A has pages T1...Tn which point to it (i.e., are citations). The parameter d is a damping factor which can be set between 0 and 1. !2AIK- We usually set d to 0.85. There are more details about d in the next section. Also C(A) is defined as the number of links going out of page A. The PageRank of a page A is given as follows:
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
Note that the PageRanks form a probability distribution over web pages, so the sum of all web pages' PageRanks will be one.
________
Конечно, вектор умножается на соб.зн-е, но оно=1 либо нормируется к 1 (1, за счет того, что сумма всех PR / к-во страниц = 1 по определению.). Векторной формулы в явном виде не давали, но если вектор=вероятности по сайтам i, а матрица=к-во ссылок с сайта i на j, это просто формализация алгоритма расчета.
2Aik-
Это как, для каждого сайта выбирать d для сходимости процесса? d, насколько я понял, вероятность того, что юзер закончил на этом сайте (или 1 минус это), и для каждого сайта своя, выбирается априори (м.б, из свойств текста). d фиттить для каждого сайта - немаленькое число свободных переменных.
Тогда http://cactuses.h1.ru/sck/pr.xls (165К)
Мне кажется, хорошо использовать такой метод- генерить страницу скриптом, который определяет переменную ACCEPT_LANGUAGE, если там есть ru, то выдается русский контент, ну и так далее по всем языкам, если есть желание()... А если ничего не найдено- то основной язык. Яндекс, по крайней мере, ставит ru.
а если несколько страниц под разные языки- то и находиться они будут отдельно. Да, можно и в параметрах указывать язык, при регистрации.
------------------
euhenio
[This message has been edited by euhenio (edited 12-10-2001).]
Не понимаю, какие найденные документы?
просто набираю эту фразу(как быстро раскрутить сайт) на первой странице Яндекса, ответ- "искомая комбинация слов нигде не встречается", проверял сейчас. Настроек вроде не ставил.