wolf

wolf
Рейтинг
1183
Регистрация
13.03.2001
Должность
интернет-маркетинг, SEO

Кстати, Акис, вот тебе статейка посерьёзней: Page, Lawrence; Brin, Sergey; Motwani, Rajeev; Winograd, Terry. The PageRank Citation Ranking: Bringing Order to the Web. Обрати внимание на definition 1 в п. 2.4.

тогда что такое "экстраполированный" PR?

Откуда ты этот термин взял?

Видимо определяется для конкретной страницы , на основе первоначальных факторов, связанных с ссылочным ранжированием, и потом уточняется при изменении общих факторов.

То есть, ты утверждаешь, что PR не статическая величина, а зависит от запроса (раз определяется на основе факторов, связанных с ссылочным ранжированием)? Бред. Ты, случайно, алгоритм RageRank с алгоритмом HITS не перепутал?

Исключения по моим данным тоже есть, например русские запросы не пострадали, кроме того сайты с PR>=6 тоже пострадали слабо. Возможно есть и другие ислючения, например для слабоконкурентных запросов или ещё что-то.

Возможно, "прошерстили" только совсем небольшую часть запросов, где народ уж слишком рьяно толкается друг с другом. И это скорее исключение, чем правило.

Страницы с 404 никак не отвлекут робота Яндекса от других страниц. Квота в 500 страниц распространяется только на те страницы, которые вернули отклик 200 на запрос If-Modified-Since

Глава II. Статья 5
Реклама должна быть распознаваема без специальных знаний или без применения технических средств именно как реклама непосредственно в момент ее представления независимо от формы или от используемого средства распространения.

Интересно, а новичок Интернета сможет "без специальных знаний или без применения технических средств" распознать, что "Директ" - это реклама? Словечко "Объявления" как-то не очень ему в этом помогает. Вот если б, к примеру, было "Рекламные объявления", тогда - другое дело. ;) А делая поиск по "Маркету", он опять таки "без специальных знаний или без применения технических средств" распознает, что он тоже видит не что иное, как рекламу?

Это сделано для того, чтобы побыстрее скормить роботу новые страницы.

Благими намерениями устлана дорога сами знаете куда.

Е-мое, я тебе про d, а не про систему

А я тебе про систему. Я не зря упомянул про теорему Кронекера-Капелли. Так вот, если внимательно проанализировать систему, то можно выяснить, что при добавлении в нее уравнения, что сумма всех PR равна 1, оно не имеет решения. Чтобы в этом убедиться, просто сложим все уравнения в системе (без этого дополнительного уравнения). После нехитрых преобразований (попрактикуйся на досуге), выясняется, что сумма всех PR равна N, где N - число уравнений (т.е. документов в базе), а стало быть, PR отдельного документа может быть больше 1. Тоггда получается, что либо нормировка применяется после решения системы N уравнений с N неизвестными, либо в нее вводятся кое-какие допущения, что бы опеспечить выполнение условия, что сумма всех PR=1. Этого можно добиться, например, заменой свободного члена (1-d) в каждом уравнениий системы на (1-d)/N. Как видишь, в этом случае значение d уже не так сильно влияет. Кстати, у Брина и Пейджа есть кое-какой намёк на возможность подобного допущения:


One important variation is to only add the damping factor d to a single page, or a group of pages.
причем тут системы уравнений к отдельной странице, если лажа в "формуле"? Она-то будет там по-любому.

Во-вторых, лажа не в формуле, а у тебя. 5/10 в баре - это отнюдь не 0.5 в формуле. ;)

К тому же ты забыл про условие нормировки - сумма PR всех страниц равна 1. По сути, мы имеем систему N+1 уравнений с N неизвестными. У этой системы свои свойства, и чтобы она имела решение, например, она должна удовлетворять условиям теоремы Кронекера-Капелли (поди, не слыхал про такую?). А ты эту формулу к отдельно взятому документу... Варвар. :)

А вот насчет того, передается ли PR по редиректу с откликом 301 или 302, нет однозначного ответа.

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

Правда, поскольку я все-таки лирик, то я выбираю такие условия:

d = 0.8
PR(T1) = 5/10
C(T1) = 1

Больше ссылок нет [ну облом мне считать много , но это не принципиально, кстати] и получаем:

PR(A) = (1-0.8) + 0.8*0.5 = 0.2 + 0.4 = 0.6 = 6/10

Видимо, что-то не работает.

Конечно, не работает. Нельзя вот так в "в лоб" использовать эту формулу для единичного документа. Купи у Ашманова труды последней конференции, я там как раз об этом говорил. :) Надо составить систему уравнений для всех страниц поискового индекса и решить её. Всё, Cossack, хватит спорить, марш на переэкзаменовку по "вышке". :)

Всего: 24501