BlockRank вместо PageRank

81

Lina

28 мая 2003, 06:51

1066

Многие из форумцев, полагаю, постоянно следят за новостями поисковиков. Но все же эту решила поместить здесь, дабы никто не пропустил. Надеюсь, пригодится.

Google может стать впятеро быстрее.

Сейчас система ранжирования Google использует метод PageRank, изобретение соучредителя компании Ларри Пейджа. Этот алгоритм определяет популярность и релевантность веб-сайтов по тому, как часто на них ссылаются другие сайты. «Вычисление PageRank для миллиарда веб-страниц может занять несколько дней. Сейчас Google ранжирует и разыскивает три миллиарда веб-страниц и для каждого персонализированного или тематического ранжирования требуются отдельные многодневные расчеты», — говорится в заявлении Стэнфордского университета.

Чтобы ускорить работу PageRank, ученые университета разработали три метода, основанных на линейной алгебре. Эти методы описаны в трех работах, представленных на Двенадцатой ежегодной конференции по World Wide Web в Будапеште (Венгрия).

Первый метод, BlockRank, дает самое значительное — трехкратное — ускорение PageRank. В нем используется сделанное учеными открытие: на большинстве сайтов до 80% ссылок указывают на другие страницы того же сайта, так что каждый сайт похож на толстый блок ссылок. PageRank обрабатывает каждую ссылку отдельно, а более эффективный метод BlockRank рассматривает все эти внутренние ссылки сайта как одно целое и, только покончив с ними, переходит к внешним ссылкам.

Второй метод использует экстраполяцию. Прежде чем сканировать веб, выдвигаются определенные предположения о важности сайта. В процессе сканирования эти предположения либо подтверждаются, либо отбрасываются, так что по мере увеличения числа обработанных ссылок растет и точность оценок. Когда собирается достаточное количество свидетельств, производится экстраполяция — то есть делается догадка о ранге сайта. По сравнению с PageRank, где ранг сайта определяется лишь по окончании обширного обследования веба, метод экстраполяции работает на 50% быстрее.

Третий метод, называемый Adaptive PageRank, опирается на тот факт, что сайты с более низким рангом обычно обсчитываются быстрее, чем сайты с более высоким. Отказавшись от дальнейшей обработки таких быстро обсчитываемых сайтов, можно увеличить быстродействие на величину до 50%.

Хотя у каждого из этих методов свои преимущества, стэнфордская команда уверена, что в сочетании они обеспечат еще лучший результат. «При использовании всех этих методов возможно еще большее ускорение, — говорит один из участников проекта Сепандар Камвар. — Наши предварительные эксперименты показывают, что их комбинация сделает вычисление PageRank впятеро быстрее. Однако нам предстоит решить ряд проблем. Сейчас мы ближе к тематическому PageRank, чем к персонализированному ранжированию».

Пока теории стэнфордцев остаются теориями — не похоже, чтобы они были как-то связаны с самим Google. «Google приветствует любой вклад в дальнейшее изучение методов анализа гиперссылок в вебе», — ответил представитель компании на вопрос CNETAsia о том, рассмотрит ли Google возможность использования предложений ученых.

Дата: 28.05.03

http://zdnet.ru/?ID=301388

85

Polite Moose

28 мая 2003, 12:19

#1

В нем используется сделанное учеными ---- открытие ----: на большинстве сайтов до 80% ссылок указывают на другие страницы того же сайта

О как! :) (И тут Билл понял, что интернет придумал не Микрософт...)

Сейчас мы ближе к тематическому PageRank, чем к персонализированному ранжированию».

тPR :) Спросите у Яндекса :)

Удачи, доброго пива (http://www.fifth-ocean.ru/) и настроения! Релевантность определяется не тИЦ, не ВИЦ, не количеством ссылок, не частотой ключевого слова, а соответствием запросу!

[Удален]

28 мая 2003, 12:28

#2

Как писал Lina
Многие из форумцев, полагаю, постоянно следят за новостями поисковиков. Но все же эту решила поместить здесь, дабы никто не пропустил. Надеюсь, пригодится.

В чем это может пригодиться? Я совершенно не представляю себе.

357

euhenio

28 мая 2003, 12:37

#3

Первый метод, BlockRank, дает самое значительное — трехкратное — ускорение PageRank. В нем используется сделанное учеными открытие: на большинстве сайтов до 80% ссылок указывают на другие страницы того же сайта, так что каждый сайт похож на толстый блок ссылок. PageRank обрабатывает каждую ссылку отдельно, а более эффективный метод BlockRank рассматривает все эти внутренние ссылки сайта как одно целое и, только покончив с ними, переходит к внешним ссылкам.

-Гы. Мы ведь подобное обсуждали уже- разделение расчета на "внутри сайта" и "между сайтами". :) Гуглевский отпор маловерам:

+%C2%C8%D6

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )

81

Lina

28 мая 2003, 14:26

#4

В чем это может пригодиться? Я совершенно не представляю себе.

Меня вот это больше всего заинтересовало:

BlockRank рассматривает все эти внутренние ссылки сайта как одно целое и, только покончив с ними, переходит к внешним ссылкам.

Таким образом не получится, что, при рассчете вИЦ, внутренние ссылки будут учитываться отдельно и их вес снизится по сравнению с внешними - т.е. будет сложнее удержать PR внутри сайта?

[Удален]

28 мая 2003, 14:33

#5

Lina, видимо не надо так близко к сердцу новости воспринимать. :) Ну какая связь между конференцией в Будапеште, ВИЦ и Google? У Google самих имеется в наличии 50 штук PhD, которые разрабатывают и внедряют нечто заведомо отличающееся от того, что обсуждается на каких-либо конференциях. И это все - тайна за семью печатями.

Таким образом не получится, что, при рассчете вИЦ, внутренние ссылки будут учитываться отдельно и их вес снизится по сравнению с внешними - т.е. будет сложнее удержать PR внутри сайта?

Вряд ли. Подобное сильно нарушит всю стройность системы.

357

euhenio

28 мая 2003, 14:47

#6

Мне, кстати, показалось, что это не просто конференция и не просто левые люди.

по крайней мере, автор статьи http://www.stanford.edu/~sdkamvar/papers/blockrank.pdf

Taher H. Haveliwala - по моему, чуть ли не в команде Гугла. По крайней мере, есть статьи (даже, кажется, с использованием данных по базе Гугла) об алгоритме PageRank...

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

[Удален]

28 мая 2003, 14:58

#7

Непохоже, чтобы он был в команде Гугла. По крайней мере среди работ, перечисленных тут http://labs.google.com/papers.html его нету вроде.

D

56

defresto

28 мая 2003, 18:03

#8

Стрёмный топик был на вебмастерволде....

Меня эта инфа немного напугала... опять всё менять...

Ну будем покупать больше доменов %)

279

Cossack

28 мая 2003, 18:25

#9

Хмм... оригинал тут: http://www.webmasterworld.com/forum34/523.htm ;).

Но ничего интересного, просто next попытка отделить зерна от плевел. Вывод прост - не делайте плевел, зрите в корень и пр... ;).

Прощание славянки... (http://www.youtube.com/watch?v=0xf9lFMWfKw)

Яндекс Вебмастер вынес товарные фиды в отдельный раздел

Все что нужно знать о DDоS-атаках грамотному менеджеру