Значение googlePR - "тулбарное", "реальное" и как их брать

Коля Дубр
На сайте с 02.03.2005
Offline
153
466

Как скриптом вытягивать у Гугла значение PR, думаю, многие уже знают. Тем не менее, позволю себе кинуть несколько ссылок, которые показались мне интересными.

http://www.google.ru/search?hl=ru&q=get+pagerank+value+%3Crk%3E&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA+%D0%B2+Google&lr=

перейти по первой ссылке (иначе требует залогинивания)

Перевожу на русский суть: для того, чтобы достать ПР, можно кинуть гугле запрос вида

http://www.google.com/search?client=navclient-auto&ch=12206152085&q=info:http%3A%2F%2Fwww%2Ewebmasterworld%2Ecom

где ch=12206152085 - ключик, который генерирует тулбар, чтоб гугле было ясно, что это не "Automated Querying", запрещенный в Terms of Use. Ключик генерируется на основе части запроса, представляющей собой УРЛ интересующего нас ресурса, и если в приведенный выше запрос подставить адрес любимого сайта, гугл покажет страшную надпись "forbidden" и предложит отослать им некий предательский код (наверно, чтоб знать, кто это с Automated Quering играется).

Дальше - интересней. Этот самый ключик ch (checksum) можно сгенерировать, и php-скрипт, делающий это, лежит в общем доступе здесь:

http://www.searchengineengine.com/files/pagerank-code.txt

Алгоритм генерации я пока не исследовал, сейчас займусь. Этот скрипт прекрасно показывает ПР, как им пользоваться подробно описано в комментариях. Но и это еще не все.

Дядька, отдавший скрипт народу (иные умельцы за такую штуку просят 200-900 угрюмых ежей), обратил также внимание, что если давать гугле запрос без префикса info: перед УРЛ (тулбар спрашивает гугл с таким префиксом) - результат получается более интересный. По его наблюдениям, получаемое таким образом значение меняется чаще, что наводит на мысль: это "more current/accurate pagerank", то есть, "более точный ПР". Потестить его сервис можно здесь:

http://www.searchengineengine.com/

А в этом форуме - обсуждают его творения и ловят несколько багов (не тестил, профиксены ли они в сервисе):

http://forums.digitalpoint.com/showthread.php?t=11573&page=1&pp=10

Вот такие дела. Где-то я уже слышал про "уточненный ПР", но это, кажется, что-то другое. Хотелось бы узнать мнения.

Если я что-то не так понял (скорее всего, оно так и есть), знающие люди меня поправят. А незнающим, думаю, будет интересно поизучать XML-ки, отдаваемые гуглом. Очень поучительное зрелище :)

Разрабатываю общую шину (http://habrahabr.ru/company/floxim/blog/268467/) помаленьку. ...а еще у меня есть бложек (http://www.blogovo.ru/).

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий