Обсуждение статей по PageRank

12 3
euhenio
На сайте с 21.09.2001
Offline
357
6473

Здесть будет продолжение обсуждения статей про PageRank и всего остального, начатого в этой ветке.

Сами статьи-

1 PageRank: начала анализа

2 PageRank: анализ потоков

Предыстория-

euhenio

-на самом деле, PR самой страницы не уменьшится только в том случае, если это "висящая страница" - т.е, которая не ссылается на другие страницы своего сайта. Если это, например, головная страница сайта, PR уменьшится за счет того, что подчиненные страницы недополучат PR от главной и, соответственно, меньше отдадут ей обратно.

AiK

Э... давно я математикой занимался. Но из механики помню такой термин - устойчивость. Так вот, PR штука устойчивая. Сколько бы ты ссылок на своём сайте не добавлял, PR будет колебатся около положения равновесия.

Кроме того, процесс вычисления PR сходящийся и невырожденный, т.е. невозможно получить ни бесконечность ни ноль. В противном случае

уже давно бы PR не применялся - при существующем числе страниц обязательно произошли бы выбросы либо в ту либо в другую сторону. Т.е. моё утверждение статистически достоверно.

Представил в красках такую картину:

злобный euhenio, раздосадованный тем, что его сайт не взяли в один из популярных каталогов, целый месяц не досыпает, употребляет кофе в немеряных количествах и кропотливо работает на созданием специального сайта. После того как сайт создан, он получает ссылку с сайта конкурента, которого в каталог взяли и подлым образом устанавливает на главной странице вновь созданного сайта ссылку на каталог. Через месяц он проверяет результаты своей работы: ура! подлый каталог теперь имеет PR в пять раз ниже. Он пишет ультимативное письмо модераторам каталога: либо вы включаете мой сайт в ваш каталог, либо я ваш PR до нуля догоню...

Как говорится, не имел ввиду ничего личного

euhenio

-только вот положение равновесия будет при меньшем PR...

-если брать статистику по "висящим страницам". На самом деле я не говорю про бесконечность и 0 - они особо ни при чем...

Сайт - в любом случае связанная система страниц. Если сылка поставлена на странице, ссылающейся обратно на другие страницы, она недодаст немного PR другим страницам сайта. А они недодадут ей, тк ссылаются на нее. В рез-те PR немного уменьшится у всего сайта.

С другой стороны, это немного можно не заметить, если на сайте много страниц

AiK

Дело в том, что при добавлении новой ссылки какие-то страницы увеличивают PR, а какие-то теряют. Причём потеря не больше чем на PR/(N^3). Это в самом худшем случае, когда обмен произведён между двумя страницами: на странице А появилась N+1 ссылка на страницу Б, а страница Б сослалась тут же на А. Если страница А содержала хотя бы 9-ть ссылок, то это изменение никто и не заметит. А если 9 предыдущих ссылок возвращали ссылки на А (типа главная), то изменения вообще окажутся за пределами точности измерений, но мы получаем новую страницу (Б) с "хорошим" PR. А если на страницу Б сослаться ещё откуда-то, то довесок к PR окажется больше, нежели чем потеря от деления.

Запутал ты меня своими вычислениями

Смотри, если ты добавляешь новую ссылку на странице, доступной с любой другой страницы сайта (например на главной), и новая страница

также содержит ссылку на эту страницу, то вероятность перехода на страницу с новой ссылкой (главную) никак не изменится. Вероятность перехода на новую страницу существенно возрастёт, а вероятность попадания на другие страницы сайта чуть-чуть уменьшится. Причём чем больше исходных ссылок на странице, тем меньше будет это уменьшение.

euhenio

Вероятность перехода на новую страницу существенно возрастёт, а вероятность попадания на другие страницы сайта чуть-чуть уменьшится. Причём чем больше исходных ссылок на странице, тем меньше будет это уменьшение.

- согласен. PR ее будет больше 0.15, но меньше 1 (если внешний PR мал). А 1 - это среднее значение для "отдельного от внешнего мира" сайта.

Смотри, если ты добавляешь новую ссылку на странице, доступной с любой другой страницы сайта (например на главной), и новая страница

-а в от с этим не согласен. Предыдущая созданная страница отдаст часть своего PR главной, увеличив ее PR.

Т.е., за счет посетителя, который случайным образом начинает со второстепенной страницы, увеличивается PR главной. Соответственно, когда таких страниц много, случайный юзер "окажется" прямо на них и перейдет на главную. Такая ситуация была рассмотрена в статье Ian Rogers'a http://www.iprcom.com/papers/pagerank/ , правда рассматривались сайты в отрыве от соседей. У меня получилось принципиально то же, PR(главной)~k*N

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
[Удален]
#1

euhenio

Отличное исследование!

Очепятка во второй части:


Откуда же берется большой PageRank?

Ответ: из неоднородности распределения ссылок по страницам. Дело в том, что все страницы сети были эквивалентны, что привело к одинаковому значению PageRank. Но если в однородном Интернете 2 страницы "обменяются ссылками", их PageRank увеличится. А у всего остального Интернета - чуть-чуть, но уменьшится. Таким образом, те, кто обмениваются ссылками, "стягивают одеяло на себя".

там надо "в однородном Интернете 1"

А вообще - с нетерпением жду третьей, финальной части.

euhenio
На сайте с 21.09.2001
Offline
357
#2

Спасибо.

там надо "в однородном Интернете 1"

-это от моей лени... : Надо так:

"Но если в однородном Интернете две страницы "обменяются ссылками"

Спасибо, исправлю.

[Удален]
#3

И сразу же вопрос!

Если карта сайта имеет на себя ссылку с главной страницы (с приличным PR), т. е. карта сайта имеет PR6, то гугль спокойненько не включит в индекс страницы, на которые карта ссылается???

euhenio
На сайте с 21.09.2001
Offline
357
#4
Если карта сайта имеет на себя ссылку с главной страницы (с приличным PR), т. е. карта сайта имеет PR6, то гугль спокойненько не включит в индекс страницы, на которые карта ссылается???

-PR6 - он ведь, вообще говоря, большой. Мы ведь не знаем реальную цифру, которая за этим обозначением стоит. Я думаю, все определяется соотношением PR и числа страниц в этой карте. (если, опять-же, не учитывать, что страницы из карты имеют и другие ссылки на себя с головы сайта, например).

Вообще, с этим минимумом PR, необходимым для индексации, не все понятно. Скорее всего, здесь нужно употреблять "вероятность индексации", а не просто говорить, что это граничное значение. С другой стороны, у меня есть случай, когда Гугль прекрасно знает ссылку на одну из страниц сайта, но не индексирует страницу. Хотя ссылающиеся на нее страницы обновляет регулярно.

Т.е., видимо, со временем проиндексирует, но чем больше страниц в карте, тем дольше придется ждать... Например, я где-то видел график зависимости "вероятность индексации-Google PR". Правда, к какому сроку эта вероятность привязывалась, непонятно...

[Удален]
#5

Можно еще глупый вопрос? :)

Оправдан ли такой подход: часть навигации сделать яваскриптом, чтобы с точки зрения роботов структура сайта была иерархической?

euhenio
На сайте с 21.09.2001
Offline
357
#6
Оправдан ли такой подход: часть навигации сделать яваскриптом, чтобы с точки зрения роботов структура сайта была иерархической?

-А чего мы хотим достичь? Большого PR на первой странице? Или равномерного распределения PR по всем страницам? На самом деле, обычно есть минимум 3 уровня иерархии - главная стр (1), головы разделов (2) и страницы подразделов (3). Я собираюсь как-то показать это в 3 части, хотя уже ненаглядно получится - переменных много. Мне кажется, на уровне 1+2 все должно быть связано плотно (тк в эти страницы должны быть хорошо заточены под популярные запросы, и PR там нужен), а 3 уровень (последний) - слабо, т.е., по одной ссылке с и на уровень 2. Это страницы - генераторы заходов по редким, 3-4 сл. запросам.

Насчет js не знаю, наверное можно. Но тогда придется определять, у кого нет js, и выдавать им обычную схему ссылок, без js. А роботы ее и должны получить (по умолчанию), и давать им что-то особое - это уже клоакинг... :)

[Удален]
#7
Как писал euhenio
-А чего мы хотим достичь? Большого PR на первой странице? Или равномерного распределения PR по всем страницам?

Цель распределить PR таким образом, чтобы страницы, находящиеся в иерархии выше, и соответственно, нацеленные на более конкурентные запросы, получали больше PR (им нужнее :))

[Удален]
#8
Как писал Interitus
Цель распределить PR таким образом, чтобы страницы, находящиеся в иерархии выше, и соответственно, нацеленные на более конкурентные запросы, получали больше PR (им нужнее :))

По моему наилучшая иерархическая структура такая:

Внешние ссылки идут на:

Главную (авторитетнее и больше)

разделы (меньше)

подразделы (как получится)

дорвеи (по необходимости)

С дорвеев ссылки с ключевыми словами/словосочетаниями идут на разделы

С Главной - на разделы

С разделов на Главную, другие разделы и подразделы

С подразделов на Главную и разделы (на другие подразделы через js, если без ссылок на другие подразделы не обойтись, а PR/ВИЦ увеличивать не нужно за счет других страниц)

Внешние ссылки на сайте не ставятся или через js или с подразделов в крайнем случае.

Особняком стоит карта сайта. С нее ссылки ведут на все разделы сайта.

Ее считать разделом или дорвеем?

Ставить на нее ссылку с главной или через js (для посетителей) или не ставить вообще?

Я считаю, что, если страниц сайта мало (10-30) можно накачать PR/ВИЦ'ем карту сайта (на нее внешние ссылки + со всех страниц), в ссылки понаписать необходимые слова/словосочетания и страницы будут "находится по ссылке" с собственной карты :D

Если страниц сайта много (50 и более) PR/ВИЦ ссылок с карты сайта получится мизерным и тогда просто засабмитить в поисковики, а ссылки на нее через js (для посетителей) или не ставить вообще.

При такой структуре PR/ВИЦ должен верно увеличиваться по логарифмической? зависимости... :)

Интересно будет узнать мнение других участников форума и особенно насчет карты сайта.

И еще, через сколько времени примерно PR/ВИЦ пересчитается раза три для всего сайта, при условии, что все ссылки известны и все страницы проиндексированы?

С уважением, Дмитрий

kit
На сайте с 01.05.2001
Offline
190
kit
#9

Я для себя вынес интуитивно такое представление об оптимальной структуре сайта.

1) Главная страница, и все внешние ссылки на неё.

2) Подразделы, но не так много, что бы их PR стал слишком низким.

3) Максимальное удаление ссылок на другие сайты, от точки входа LP на сайт.

Master-X.com (http://www.master-x.com) - крупнейшее сообщество русскоязычных эдалт вебмастеров.
Space
На сайте с 29.04.2002
Offline
90
#10
Как писал euhenio

Насчет js не знаю, наверное можно. Но тогда придется определять, у кого нет js, и выдавать им обычную схему ссылок, без js. А роботы ее и должны получить (по умолчанию), и давать им что-то особое - это уже клоакинг... :)

А может просто запретить их индексацию в robots.txt?

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий