Уменьшение тиц, пр за счёт обратных ссылок

Liave · 2009-02-03T08:40:42.0000000Z

Какая будет разница если я куплю ссылочку с сайта на котором уже находится 10 ссылок, или такую же ссылочку, но на сайте без ссылок (чистом)

2542

The WishMaster

3 февраля 2009, 16:50

#11

Dryoma:
Садовский с математикой явно не дружи

Можно конкретные примеры его ошибок?

Кому старенького креативного копирайтера? Тематики - туризм, СЕО, творчество, кулинария, шизотерика :)

[Удален]

3 февраля 2009, 17:06

#12

Первыми, кто запатентовал систему учета внешних ссылок стала компания Google. Алгоритм получил название PageRank.

PageRank рассчитывается для каждой веб-страницы отдельно, и определяется PageRank’ом (цитируемостью) ссылающихся на нее страниц. Своего рода замкнутый круг.

Главная задача заключается в том, чтобы найти критерий, выражающий важность страницы. В случае с PageRank таким критерием была выбрана теоретическая посещаемость страницы.

Рассмотрим модель путешествия пользователя по сети путем перехода по ссылкам. Предполагается, что пользователь начинает просмотр сайтов с некоторой случайно выбранной страницы. Затем по ссылкам он переходит на другие ресурсы. При этом есть вероятность того, что посетитель покинет сайт и вновь начнет просмотр документов со случайной страницы (в алгоритме PageRank вероятность такого действия принята 0.15 на каждом шаге). Соответственно, с вероятностью 0.85 он продолжит путешествие, перейдя по одной из доступных на текущей странице ссылок (все ссылки при этом равноправны). Продолжая путешествие до бесконечности, он побывает на популярных страницах много раз, а на малоизвестных - меньше.

Таким образом, PageRank веб-страницы определяется как вероятность нахождения пользователя на данной веб-странице; при этом сумма вероятностей по всем веб-страницам сети равна единице, так как пользователь обязательно находится на какой-либо странице.

Поскольку оперировать вероятностями не всегда удобно, то после ряда преобразований с PageRank можно работать в виде конкретных чисел (как, например, мы привыкли видеть его в Google ToolBar, где каждая страница имеет PageRank от 0 до 10).

Согласно описанной выше модели получаем, что:

- каждая страница в сети (даже если на нее нет внешних ссылок) изначально имеет ненулевой PageRank (хотя и очень маленький);

- каждая страница, имеющая исходящие ссылки, передает часть своего PageRank страницам, на которые ссылается. При этом переданный PageRank обратно пропорционален числу ссылок на странице – чем больше ссылок, тем меньший PageRank передается по каждой;

- PageRank передается не полностью, на каждом шаге происходит затухание (та самая вероятность 15%, когда пользователь начинает просмотр с новой, случайно выбранной, страницы).

Рассмотрим теперь, каким образом PageRank может влиять на ранжирование результатов поиска (говорим «может», так как в чистом виде PageRank уже давно не участвует в алгоритме Google, как это было раньше, но об этом ниже). С влиянием PageRank все обстоит очень просто – после того как поисковая система нашла ряд релевантных документов (используя текстовые критерии), отсортировать их можно согласно PageRank – так как логично будет предположить, что документ, имеющий большее число качественных внешних ссылок, содержит наиболее ценную информацию.

Таким образом, алгоритм PageRank "вытесняет" наверх в поиске те документы, которые и без поисковика наиболее популярны.

3.6 Google PageRank – практическое использование

В настоящее время PageRank не используется непосредственно в алгоритме Google. Это и понятно – ведь PageRank характеризует лишь количество и качество внешних ссылок на сайт, но совершенно не учитывает ссылочный текст и информационное содержимое ссылающихся страниц – а именно этим факторам придется максимальное значение при ранжировании. Предполагается, что для ранжирования Google использует так называемый тематический PageRank (то есть учитывающий только ссылки с тематически связанных страниц), однако детали этого алгоритма известны лишь разработчикам Google.

Узнать значение PageRank для любой веб-страницы можно с помощью Google ToolBar, который показывает значение PageRank в диапазоне от 0 до 10. Следует учитывать, что Google ToolBar показывает не точное значение PageRank, а лишь диапазон PageRank, в который попадает сайт, причем номер диапазона (от 0 до 10) определяется по логарифмической шкале.

Поясним на примере: каждая страница имеет точное значение PageRank, известное только Google. Для определения нужного диапазона и вывода информации на ToolBar используется логарифмическая шкала (пример показан в таблице)

Реальное значение PR Значение ToolBar

1-10 1

10-100 2

100-1000 3

1000-10.000 4

и т.д.

Все цифры условны, однако наглядно демонстрируют, что диапазоны PageRank, показываемые в Google ToolBar, не равнозначны друг другу. Например, поднять PageRank c 1 до 2 легко, а с 6 до 7 гораздо сложнее.

На практике PageRank используется в основном в двух целях:

1. Быстрая оценка уровня раскрученности сайта. PageRank не дает точной информации о ссылающихся страницах, но позволяет быстро и просто «прикинуть» уровень развития сайта. Для англоязычных сайтов можно придерживаться следующей градации: PR 4-5 – наиболее типичный PR для большинства сайтов средней раскрученности. PR 6 – очень хорошо раскрученный сайт. PR 7 – величина, практически недостижимая для обычного вебмастера, но иногда встречается. PR 8, 9, 10 – встречаются только у сайтов крупных компаний (Microsoft, Google и т.п.). Знание PageRank можно использовать при обмене ссылками, для того чтобы оценить качество предложенной к обмену страницы и в других подобных ситуациях.

2. Оценка уровня конкуренции по поисковому запросу. Хотя PageRank и не используется непосредственно в алгоритмах ранжирования, тем не менее позволяет косвенно оценить конкурентность заданного запроса. Например, если в выдаче поисковой системы стоят сайты с PageRank 6-7, то сайт с PageRank 4 имеет очень мало шансов подняться в топ.

Еще одно важное замечание – значения PageRank, показываемые в Google ToolBar пересчитываются достаточно редко (раз в несколько месяцев), поэтому ToolBar показывает в некотором роде устаревшую информацию. То есть сама поисковая система Google учитывает изменения во внешних ссылках гораздо быстрее, чем эти изменения отображаются в Google ToolBar.

12

Dryoma

3 февраля 2009, 18:35

#13

The WishMaster:
Можно конкретные примеры его ошибок?

Читал давно, так что кое чего из того что понял уже забыл. Если коротко, то:

Уравнения Брина и Пейджа хорошие. Хорошие в том смысле, что не взяты с потолка. Например, при 0<d<1 они имеют единственное решение, причем без отрицательных PageRankов. Вообще говоря это случается не со всеми линейными уравнениями. Более того, PageRankи удовлетворяющие этим уравнениям имеют небольшие значения --- порядка кол-ва ссылок на сайт.

Садовский предлагает неправильную итеррационную схему для нахождения решения этой системы уравнений. Если сисетму уравнений Пейджа-Брина записать (дальше будет много букаф)

x= A x + b, (1)

где x - столбец PR всех сайтов, b - столбец из (1-d), A --- все остальное, т е матрица коэффициентов типа d/n, где n-кол-во ссылок, то итеррационная схема Садовского выглядит так:

(КАК НЕПРАВИЛЬНО)

x0 = 1 (столбец единиц) --- нулевое приближение,

x1 = (A+E) x0 = A+E --- первое приближение (тут E --- единичная),

x2 = (A+E) x1 = (A+E)^2 --- второе приближение (^ это возведение в степень), продолжая дальше, имеем

xi = (A+E)^i. (2)

У нас A --- малая матрица. Под этим я понимаю что, A^i стремится к нулю при i стремится к бесконечности. Последний факт следует из того, что сумма элементов матрицы A в каждом столбце равна d<1. Тогда (A+E) --- матрица, чуть большая единичной (при возведении в степень стремится к бесконечности). Соответсвенно, при стремлении i к бесконечности решение (2) неограниченно растет. Поэтому, эта итеррационная схема не то что не сходится к ответу --- она вообще не сходится.

(КАК ПРАВИЛЬНО:)

x0 --- любое (в этом и достоинство большинства итеррационных схем --- они не зависят от начального приближнния)

x1 = A x0 + b

x2= A x1 + b = A (A x0 + b) + b = A^2 x0 + (E + A) b,

x3 = A x2 + b = A^3 x0 + (E + A + A^2) b, и т д. В конце концов получим

xi = A^i x0 + (E + A + A^2 + ... + A^(i-1)) b

При стремлении i к бесконечности, из-за малости A первое слагаемое стремится к 0 (тут теряется зависимость от начального приближения). А скобка в свою очередь стремится к 1/(E-A). Итого, вторая итерационная схема дает решение

x = b/(E-A).

Прямой подстановкой можно убедиться, что это --- решение уравнения (1).

Таким образом, предложенный Садовским MiniRank не решает задачу о нахождении PageRankа. На основании неправильной итеррационной схемы Садовский делает выводы о огромных значениях PageRanka, хотя во всех предложенных ситуациях он порядка 0-10. Хотя, некоторые выводы он делает правильные, например, об эффекте обратной связи. Но, как говорят в таких случаях: "Все персонажи - выдуманы. Всякое сходство с реальными лицами или фактами - кажущееся, любые совпадения - случайны, аналогии - неуместны.."

Пожалуй, хватит 😆.

65

xant

4 февраля 2009, 03:54

#14

The WishMaster:
Можно конкретные примеры его ошибок?

Цитата из пункта 2.1.1 работы The Anatomy of a Search Engine за авторством "каких-то" Сергея Брина и Ларри Пейджа.

the sum of all web pages' PageRanks will be one.

"Сумма PageRank всех страниц будет равна 1".

Сравните с нереальными значениями товарища Садовского.

---

В-общем, товарищ Dryoma всё правильно расписал, хотя и сложновато для тех, кто не дружит с матрицами.

Смысл в том, что на первом шаге все страницы получают одинаковый вес (любой, это неважно). На последующих шагах они обмениваются своим весом (передают его по ссылкам), но сумма весов всех страниц остается неизменной (вес ниоткуда не появляется и никуда не исчезает). Смысл труда Брина и Пейджа - они доказали, что для заданного набора страниц и ссылок такой алгоритм устойчив и сходится, причем сходится быстро, поэтому его можно использовать на практике для вычисления "авторитетности" страниц.

Эксклюзивные сайты и веб-2.0 приложения под ключ. Дорого.

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы