Cossack

Cossack
Рейтинг
279
Регистрация
17.12.2002
То есть, каталог Гугля - это немного переработанная база ODP и набравшись терпения, можно дождаться попадания сайта и в каталог Гугля? А можно и не дождаться? Естественно, речь о сайте, включенном в ODP.

Почти 100 % вероятность, в большинстве случаев - просто вопрос времени, следите за snippets своих сайтов в выдаче Google ;).

Если из трех выбирать один вариант, от какого на Ваш взгляд больше пользы с т.зр. PR и тИЦ?

Мы не обсуждаем вопросов связанных с редактированием или внесением сайтов, а также с последствиями таких действий ;). Наличие же одинаковых или похожих ссылок с одного и того же места на один и тот же домен/сайт обычно однозначно трактуется поисковиками ;).

Формулу я вижу, и вижу как ее пытались модифицировать, подгоняя под те или иные теории ;).

Давай отвлечемся от математики, и посмотрим, что такое 1 в смысле PR:

1. PR нельзя суммировать, поскольку результатом будет вероятность посещения любой из страниц, PR которых был просуммирован, а при суммировании PR всех страниц будет вероятность посещения любой страницы в Сети [= 100% после подключения ;)]. Такой подход напоминает мне о средней температуре по больнице.

2. Скромный Google приравнял себя и несколько таких же скромных своих партнеров к 100% ;), но ведь первоначальное определение PRs как вероятностей дает что-то вроде:

10/10 -> 50.1% - 100%

9/10 -> 25.5% - 50.0%

8/10 -> 12.9% - 25.4%

7/10 -> 6.41% - 12.8%

6/10 -> 3.23% - 6.40%

5/10 -> 1.63% - 3.22%

4/10 -> 0.81% - 1.62%

3/10 -> 0.41% - 0.80%

Note: Даже при таком раскладе понятно, что 3/10 это минимальный уровень, когда вероятность визита посетителя превосходит ноль после округления [что наверное и было выбрано как пороговое значение] ;).

Если такой расклад не объясняет наличие сайтов с высокими PR, но не сильно посещаемых, то логично предположить, что на определение PR влияют какие-то другие факторы, не показанные в уравнении, более того наличие hubs и сайтов-авторитетов не вписывается в уравнения, и я лично склонен относится к определению PR на основе checklist, типа есть ссылка пошел плюс, есть спам-фактор пошел минус.

Что в принципе и отражено в первоначальном уравнении в виде необъясненного коэффициента d, который может быть от 0 до 1, и который собственно может определять все ;). Поэтому, повторение разными авторами 0.85 как фиксированной величины - просто ламерство.

Более того, анализ уравнения показывает, что отсутсвие на странице внешних ссылок ведет к понижению, или скорее не способствует повышению ее PR, поскольку она может оказаться тупиковой для зверя и он просто выключит компьютер. Хотя, с другой стороны, в идее PR допущена возможность того, что такая страница будет конечным пунктом для большого числа зверей и тогда там будет накопление PR, в результате чего автора рано или поздно убедят воткнуть там ссылку на внешнюю страницу и цепочка переходов продолжится.

А вот насчет "зависимости от таких попаданий" у Брина с Пейджем, увы, ничего не сказано.

Меня смущает непереводимая игра слов:

Additionally, we factor in hits from anchor text and the PageRank of the document.

а также найденные в разработках швейцарских последователей Пейджа и Брина идеи о двух- и трех- уровневой оценке PR (а не вычислении !!!), на основе анализа сначала входящих, а потом исходящих ссылок с учетом вероятности кликов/переходов по ним.

Принимая во внимание отдельные признания о том, что Google обращает внимание на хиты по сайтам в выдаче, трудно не задуматься. Кроме того, можно также заметить интересный процесс "девальвации" PR на заброшенных сайтах...

Блиннннннн...

1) Ну неужели не понятна разница между выбором и нахождением на странице? PR считается до того, как туда попадает зверь и может зависеть от количества таких попаданий ;). Это одно из объяснений второй 6, потому как туда кликает достаточно много народа ;). Недоделал, случайно ;).

2) Жень, а как можно

сделав несколько ссылок с 5-рок, можно получить 10-ку?

получить 10 сложив 5/10 и 5/10? И кто сказал, что PR складывается, вычитается, утекает? Несколько авторов, копирующих друг друга?

Мы экспериментировали с "политически некорректными" словами и ссылками - за них понижает, и мои коллеги тихо сползали со стулэв видя что на сайте все страницы стоят с 6, а страница с "политически некорректными" ссылками с 4 ;). Потом выравнялось, видимо после перепроверки, а потом мы их по другому поставили.

Или надежда греет на скорый догон PR хомпаги до уровня Гугла?

Хомяк уже в пути ;). Интересен целевой трафик, потому будет не быстро.

Каким образом происходит попадание присутствующего в ODP сайта в каталог Гугла? Само собой или сабмитить урл надо?

По-моему, я уже ответил в другом посте ;).

Если сайт и(или) его разделы тематически подходит под разные разделы ODP, пытаться вносить его в эти разные разделы 1) можно? 2) Нужно?

Зависит от сайта, его содержания и структуры. Пытаться можно и нужно, спамить не советую, потом можете быть удивлены ответной реакцией ;).

site's content is available in more than one language

Автопереводы не подходят, речь идет о содержании и функциональности версии сайта на другом языке, фактически о другом сайте, поскольку дословный перевод практически невозможен, и совпадать в лучшем случае будут названия и структура.

www.domain.ru/cgi-bin/yabb/YaBB.cgi

PR не передается ;), он определяется на основании ссылок найденных роботом ;). Если только cgi-bin разрешен к индексации ;).

Женя, разница есть. Я тебе и говорю, что ты не понял.

Не так:

Таким образом, PageRank веб-страницы был определен как вероятность нахождения пользователя на этой веб-странице; при этом, конечно, сумма вероятностей по всем веб-страницам сети равна единице - где-то он должен обязательно быть!

А вот так:

PageRank can be thought of as a model of user behavior. We assume there is a "random surfer" who is given a web page at random and keeps clicking on links, never hitting "back" but eventually gets bored and starts on another random page. The probability that the random surfer visits a page is its PageRank.

Не "нахождения" (в любом смысле этого слова), а клика, визита, или более точно - выбора;).

Собственно, PR это вектор, направление движения посетителя, вероятность выбора им той или иной страницы, а то что там цифрой показано - ерунда, могли и букву сделать ;).

З.Ы. На твоем сайте - я имел ввиду другое, если хочешь - кину в личку ;).

Greenwood, я не говорил о физике ;). Как утверждал мой первый тренер - я законченный лирик, и он был прав - я повторил путь брата, закончившего Бауманку с 5 захода ;), и на 42й попытке почувствовав себя снова молодым - решил потратить несколько лет своей жизни на и вопросы связанные с развитием Интернет проектов. Для меня это не поиск средств к существованию и не способ разбогатеть, а интересное и полезное хобби. Мне особенно интересны новые проекты, которые можно интегрировать с моими новыми проектами, о чем некоторые уже в курсе ;).

O'k, закончим с лирикой.

Анна, смысл не в том, чтобы разместить побольше ссылок, Вас кто-то обманул ;). Ссылки с кнопок считаются тому куда кнопка ведет, но со многих мест (например - mail.ru) идут обратные ссылки и почти все поисковики их учитывают, но заметьте - я не сказал, что учитывают в плюс ;).

Euhenio, меня поражают твои знания формул и принципов работы, которые почему-то привели к "склейке" твоего сайта в Google и каким-то малопонятным snippets ;). Сапожник без сапог? Но давай о деле. Я вижу что ты не понимаешь сути PR, а именно того, что это не ранг, а вероятность выбора конкретной страницы средним пользователем.

1) 5 или 6 или любое число в тулбаре - это другая шкала, реальный PR может быть 10^5...

Это реальный коэффициент вероятности выбора данной страницы, округленный до десятых. Как он используется - другой разговор, но я рад,что тебе понравилась моя идея о том, что PR это степень.

Это, кстати, в той статье, что тебя прикалывала, и было написано , могу дать ссылку, если ты позабыл...

Меня прикалывают почти все статьи о PR, особенно с идеями о его консервации, передаче, утечке и прочем бреде ;). Оно возможно только в случае если PR - скалярная величина, а такого сказано не было ;). Так, что все формулы можно забыть, место на хосте использовать под порнуху, а бумагу по желанию.

2) Кроме того, этот PR округляется до целого. Поэтому между 5 и 5 может быть такая разница, что один - почти 4, а другой - почти 6... Этого ты тоже не знал?

Не повторяй ерунду, PR<=1 и в баре округление идет до десятых. Кроме того, я упомянул, что по всем найденым в Сети инструментам по расчету и определению - там была минимальная разница в 3% ;). Естественно, это прикидки, но сегодня я начинал работу с русской версией Козака - посмотрим какой будет результат ;).

Народ, смотреть не получается ;)? Там в пункте приведена красивая такая картинка с иллюстрацией выдаче и такими яркими барами с указанием процентов, ранжирование выдачи и тут же в тексте:

The PageRanks are the percentages in red along with bar graphs.

Собственно картинка прекрасна, она показывает многое ;).

Я как почти PhD подтверждаю, блин, обычно такой пример обязан раскрывать суть и почти наверняка картинка много раз объяснялась авторами устно. Слайд все-таки. В ней один из ответов. Второй в "вероятностном" смысле PR и его максимальном значении равном 1. IMHO PR - это вероятность выбора, а не ранг в прямом понимании этого слова. И есть факторы повышающие такую вероятность для конкрентной страницы, типа <title> или anchor текст, и факторы понижающие, например - наличие большого числа одинаковых текстов где-то ;).

Все, дальше только за деньги ;).

Marilda, каталога Google - нет, это немного "исправленная" копия последнего взятого Google-м rdf dump Открытого Каталога. Причем Google показывает данные с неравномерной задержкой, видимо отражающей его приоритеты в crawling.

Всего: 5991