Влияние Link popularity на рейтинг в поисковых машинах...

12
Sergey Petrenko
На сайте с 23.10.2000
Offline
482
1160

Вопрос Евгению - на твоем сайте я видел довольно подробное описание, как определяется релевантность страницы в Google. Подскажи, как в этой формуле учитывается Link popularity?

E
На сайте с 24.10.2000
Offline
111
#1

По сути дела это и есть Link popularity, только учитывается не просто количество ссылок, а "вес" (или рейтинг) каждой ссылки.

Зависит сие от рейтинга документа, на котором стоит эта ссылка и от общего количества ссылок на документе (чем больше, тем рейтинг у каждой отдельной ссылки ниже).

AiK
На сайте с 27.10.2000
Offline
257
AiK
#2

Что-то я слабо догоняю как может быть связано количество ссылающихся на тебя страниц с релевантностью запроса?

Если бы так было, то на всех первых местах в поисковиках счётчики бы популярные стояли.

Объяснитесь.

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#3

Не совсем так. Должно быть, по крайней мере. Релевантность само собой, но при этом выше стоит тот, на кого ссылок больше.

E
На сайте с 24.10.2000
Offline
111
#4

Originally posted by Gray:
Не совсем так. Должно быть, по крайней мере. Релевантность само собой, но при этом выше стоит тот, на кого ссылок больше.

И эти ссылки "ценнее". Скажем, если на

тебя ссылается microsoft.com

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#5

В подтверждение сказанного Женей - цитата прямо с Google -

PageRank relies on the uniquely democratic nature of the web by using its vast link structure as an indicator of an individual page's value. In essence, Google interprets a link from page A to page B as a vote, by page A, for page B. But, Google looks at more than the sheer volume of votes, or links a page receives; it also analyzes the page that casts the vote. Votes cast by pages that are themselves "important" weigh more heavily and help to make other pages "important."

Ashmanov
На сайте с 21.11.2000
Offline
66
#6

Основатели Google Брин и Пейдж применили в нём так называемый алгоритм PageRank, запрограммированный ими ещё в аспирантуре Стэнфорда.

Это некоторый способ вычислять вес страницы по тому, сколько на неё входящих ссылок в индексе, и насколько аворитетны сайты, с которых они приходят.

Естественно, возникает матрица ссылок всех страниц Интернета на всех - матрица инцидентности, сумасшедшей размерности, но очень разреженная. Они назначают для начала всем страницам ранг =1, а потом пересчитывают матрицу, учитывая важность ссылок - то есть вычисленный ранг входящих ссылок. Авторитетные страницы дают более авторитетные ссылки.

Через определённое количество итераций над матрицей процесс сходится и получаются ранги страниц, сильно отличные от 1. Там есть специальная эргодическая теорема о собственных векторах этой матрицы, которая и говорит, что процесс сойдётся.

В результате запрос про деятельность некоей фирмы выводит на первое место сайт самой фирмы, а не упоминания о ней в третьих местах, и так далее.

Собственно сам алгоритм всем известен, и борьба идёт за скорость вычислений, сжатие матрицы, упрощения, не влияющие на качество, за улучшения качества, и так далее. Сейчас реализация PageRank - тема курсовых работ в университетах.

Сейчас в алгоритм вводят уже категории сайтов - например, авторитеты, на которых все ссылаются (библиотека) и узлы, ссылающиеся на всех (Yahoo).

Кстати, именно пересчёт матрицы по авторитетности ссылок и не позволяет собраться малой тусовкой и давать ссылки друг на друга - это вряд ли поможет повысить ранг.

Игорь Ашманов, Рамблер.

С уважением, Игорь Ашманов Все для оптимизации (рассылка, сервисы): www.optimization.ru (www.optimization.ru) Сервис по созданию собственных поисковиков: www.flexum.ru (www.flexum.ru)
I
На сайте с 27.01.2001
Offline
61
#7

Тем не менее на многие популярные запросы он выводит прежде всего входные страницы, сделанные под этот поисковик, а не сами сайты...

I
На сайте с 15.12.2000
Offline
80
#8

<font face="Verdana" size="2">Originally posted by Igoryan:
Тем не менее на многие популярные запросы он выводит прежде всего входные страницы, сделанные под этот поисковик, а не сами сайты... </font>

Причина проста: лексика ссылок - это примерно 5 процентов от лексики основного текста.

Отсюда вывод: PageRank (мы называли его "взвешенный индекс цитировния" еще до 1998 года)- вещь полезная для каталогов на 100%, а для искалок на 5%.

Увы

F
На сайте с 15.11.2000
Offline
116
#9

<font face="Verdana" size="2">Originally posted by iseg:
Причина проста: лексика ссылок - это примерно 5 процентов от лексики основного текста.</font>

А разве "взвешенный индекс цитирования" учитывает лексику? Я думал, что это отдельная возможность Google по индексации текста ссылок, не затрагивающая алгоритма определения веса страниц.

С уважением,

Александр Садовский.

N
На сайте с 08.03.2001
Offline
22
#10

<font face="Verdana" size="2">Originally posted by iseg:
Отсюда вывод: PageRank (мы называли его "взвешенный индекс цитировния" еще до 1998 года)- вещь полезная для каталогов на 100%, а для искалок на 5%.
Увы
</font>

Чем же это для каталогов полезнее?

Николай
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий