Нужен скрипт определения PR Google

Volkpanda
На сайте с 25.09.2006
Offline
147
1415

Большой респект всем кто откликнулся. Суть вопроса в том, что в каталоге хочу сделать сортировку по ПР, но скрипта нигде кпока не нашел. Если не влом закинуть, пишите как блогадарить! Спасибо.

fleyg
На сайте с 21.09.2005
Offline
143
#1

<?

$file=file_get_contents("http://www.freelance-help.com/google-ranking-report/pagerank-checker.php?url=http://www.site.com");

$data=split('Page Rank - ',$file);

$data2=split(" ",$data[1]);

$pr=$data2[0];

echo $pr;

?>

писал 47 секунд

Mmonger
На сайте с 01.12.2005
Offline
165
#2

function zeroFill($a, $b){

$z = hexdec(80000000);
if ($z & $a){
$a = ($a>>1);
$a &= (~$z);
$a |= 0x40000000;
$a = ($a>>($b-1));
}else{
$a = ($a>>$b);
}
return $a;
}

function mix($a,$b,$c) {
$a -= $b; $a -= $c; $a ^= (zeroFill($c,13));
$b -= $c; $b -= $a; $b ^= ($a<<8);
$c -= $a; $c -= $b; $c ^= (zeroFill($b,13));
$a -= $b; $a -= $c; $a ^= (zeroFill($c,12));
$b -= $c; $b -= $a; $b ^= ($a<<16);
$c -= $a; $c -= $b; $c ^= (zeroFill($b,5));
$a -= $b; $a -= $c; $a ^= (zeroFill($c,3));
$b -= $c; $b -= $a; $b ^= ($a<<10);
$c -= $a; $c -= $b; $c ^= (zeroFill($b,15));
return array($a,$b,$c);
}

function GoogleCH($url, $length=null, $init=GOOGLE_MAGIC){
if(is_null($length)){
$length = sizeof($url);
}
$a = $b = 0x9E3779B9;
$c = $init;
$k = 0;
$len = $length;
while($len >= 12){
$a += ($url[$k+0] +($url[$k+1]<<8) +($url[$k+2]<<16) +($url[$k+3]<<24));
$b += ($url[$k+4] +($url[$k+5]<<8) +($url[$k+6]<<16) +($url[$k+7]<<24));
$c += ($url[$k+8] +($url[$k+9]<<8) +($url[$k+10]<<16)+($url[$k+11]<<24));
$mix = mix($a,$b,$c);
$a = $mix[0]; $b = $mix[1]; $c = $mix[2];
$k += 12;
$len -= 12;
}
$c += $length;
switch($len){
case 11: $c+=($url[$k+10]<<24);
case 10: $c+=($url[$k+9]<<16);
case 9 : $c+=($url[$k+8]<<8);
case 8 : $b+=($url[$k+7]<<24);
case 7 : $b+=($url[$k+6]<<16);
case 6 : $b+=($url[$k+5]<<8);
case 5 : $b+=($url[$k+4]);
case 4 : $a+=($url[$k+3]<<24);
case 3 : $a+=($url[$k+2]<<16);
case 2 : $a+=($url[$k+1]<<8);
case 1 : $a+=($url[$k+0]);
}
$mix = mix($a,$b,$c);
return $mix[2];
}

function strord($string)
{
for ($i = 0; $i < strlen($string); $i++)
{
$result[$i] = ord($string{$i});
}
return $result;
}

function get_google_pr($url, $proxy = '')
{
$url = 'info:http://' . $url;
$checksum = GoogleCH(strord($url));
$google_url = sprintf('/search?client=navclient-auto&ch=6%u&features=Rank&q=' . $url, $checksum);

$host = 'www.google.com';
$result = '';
if ($proxy == '')
{
$fp = @fsockopen($host, 80, $errno, $errstr, 20);
if ($fp)
{
$out = '';
$out .= "GET $google_url HTTP/1.1\r\n";
$out .= "Host: $host\r\n";
$out .= "Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/x-icq, application/x-shockwave-flash, */*\r\n";
$out .= "Accept-Language: ru\r\n";
$out .= "User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)\r\n";
$out .= "Connection: Close\r\n\r\n";
fwrite($fp, $out);
while (!feof($fp))
$result .= fgets($fp, 1024);

fclose($fp);
}
}
else
{
preg_match('/^(?:http\:\/\/)?(.+)\:(\d{0,5})$/is', $proxy, $arr);
$ip = $arr[1];
$port = $arr[2];

$fp = @fsockopen($ip, $port, $errno, $errstr, 20);
if ($fp)
{
$out = '';
$out .= "GET http://$host$google_url HTTP/1.1\r\n";
$out .= "Host: $host\r\n";
$out .= "Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/x-icq, application/x-shockwave-flash, */*\r\n";
$out .= "Accept-Language: ru\r\n";
$out .= "User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)\r\n";
$out .= "Connection: Close\r\n\r\n";
fwrite($fp, $out);
while (!feof($fp))
$result .= fgets($fp, 1024);

fclose($fp);
}
}

if ($result != '')
{
if (preg_match('/Rank_\d+\:\d+\:(\d+)/is', $result, $arr))
return intval($arr[1]);
else
return '-';
}
else
return '-';
}

function google_pr($url, $proxy = '')
{
if (!is_array($url))
$url = array($url);

$pr_arr = array();

foreach ($url as $key => $val)
{
if (preg_match('/^http\:\/\//is', $val))
$val = substr($val, 7);

$url_www = $val;
if (preg_match('/^www\./is', $val))
$val = str_replace('www.', '', $val);
else
$url_www = 'www.' . $val;

$pr = get_google_pr($val, $proxy);

$pr_www = get_google_pr($url_www, $proxy);

if ($pr_www > $pr)
$pr_arr[] = $pr_www;
else
$pr_arr[] = $pr;
}
rsort($pr_arr, SORT_NUMERIC);
return $pr_arr[0];
}

get_google_pr($url, $proxy = '') - возвращает PR для домена в том виде, в котором он указан (без учёта www). $url здесь без http:// надо передавать.

google_pr($url, $proxy = '') - опледеляет PR для домен с www и без www и возвращает наибольший. Также можно передать массив урлов, тогда PR определится для каждого урла из масива (для каждого с www и без www) и вернётся наибольший. Здесь урлы можно и с http:// и без него передавать.

Прокси задаётся в формате ip:port. Если прокси задан, то обращения к гуглю будут через него.

Всё будет хорошо, но мы приложим усилия!
Z
На сайте с 19.03.2005
Offline
18
#3

упс, уже опередили

fleyg
На сайте с 21.09.2005
Offline
143
#4

Нне, ну нормально так минусами швыряться.

А теперь поподробнее я пропарсил за 18 минут 15 000 доменов этим.

А этот скрипт тупить начинает уже на 1000, это при том, что у меня далеко не виртуальный хостинг.

fleyg
На сайте с 21.09.2005
Offline
143
#5

И еще до кучи, нету проблемы с нахождением рабочих и быстрых проксей, признавайтесь кто минус поставил?

Так что из этого лучше очень спорный вопрос для минуса.

bs1
На сайте с 10.11.2005
Offline
51
bs1
#6

если хотите сделать массовый сервис - рекомендую не просто написать скрипт, а сделать к нему кеширование, иначе 100 пользователей завалят сервак.

L
На сайте с 24.02.2005
Offline
181
#7

Mmonger, а не сталкивались с тем, что не на всех хостингах такое катит? Просто на некоторых версия РНР есть такая проблема с большими числами и checksum не правильно генерируется. Я не смог так найти тот код, который бы работал на всех хостингах

L
На сайте с 24.02.2005
Offline
181
#8

В общем нашел как проблему решить, всем, кому интересно - пишите в личку

Mmonger
На сайте с 01.12.2005
Offline
165
#9
Locker:
В общем нашел как проблему решить, всем, кому интересно - пишите в личку

С такой проблемой не сталкивался. Опишите прямо здесь, думаю, это многим будет интересно.

ZO
На сайте с 16.06.2006
Offline
4
#10

<!-- code zakladka.org.ua -->

<a href="http://zakladka.org.ua" title="Каталог україномовних сайтів">
<img src="http://zakladka.org.ua/button.google.png" border="0" width="88" height="31" alt="Каталог україномовних сайтів">
</a>
<!-- code zakladka.org.ua -->

<!-- code zakladka.org.ua -->

<a href="http://zakladka.org.ua" title="Каталог україномовних сайтів">
<img src="http://zakladka.org.ua/button.yandex.png" border="0" width="88" height="31" alt="Каталог україномовних сайтів">
</a>
<!-- code zakladka.org.ua -->
- каталог україномовних сайтів (http://zakladka.org.ua)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий