Есть ли у кого скрипт для проверки обратной ссылки?

R34-zevs
На сайте с 15.07.2006
Offline
238
608

Есть ли у кого скрипт для проверки обратной ссылки. Причем который будет учитывать, что ссылки вида <!-- http://site.ru --> это "плохая ссылка" и чтоб учитывал, когда у ссылки присутствует noindex и nofollow и считал ссылку тоже "плохой". А также проверку на индексацию через xml.yandex.ru

Агентство недвижимости Фабрика Жилья (http://xn--80aacvicll3bzbzgqb.xn--p1ai/)
AlexVenga
На сайте с 10.04.2007
Offline
190
#1

Есть с проверкой вообще на все, кроме индексации....

типа роботс в файле, на странице, ноиндекс, каменты и прочее проверяет.

Стукнись в асю (в подписи)

AlexVenga добавил 23.03.2011 в 14:40

Вот, нашел функцию:

function check_url_str($url, $needle, $charset='utf-8')

{

$contents = @file_get_contents($url);

if (!$contents)
return '<a href="'.$url.'" target="_blank">Страница</a> недоступна! ';


if (strtolower($charset) !== 'utf-8') $contents = iconv($charset, "utf-8", $contents);

if (!$contents)
return 'Ошибка перекодировки! ';

if (strpos(preg_replace("/[\r\n]+/", " ", $contents), $needle)===false)
return 'На <a href="'.$url.'" target="_blank">странице</a> нет кода! ';

$indexing='';
if (preg_match('/<META([^>]*)\s+CONTENT=(?:")?NOINDEX(?:")?([^>]*)>.*<\/head>/siU', $contents)) {
$indexing.='Индексация <a href="'.$url.'" target="_blank">страницы</a> запрещена в META тэгах! ';
}


$path = parse_url($url);
$bn_url_link = basename($url);

$dir_check = str_replace($path["host"], "", $url);
$dir_check = str_replace($bn_url_link, "", $dir_check);
if ($dir_check == "/") $dir_check = "";
$dir_check = str_replace('/', '\/', $dir_check);

$robot = @file("http://".$path["host"]."/robots.txt");
$robot_check = @implode($robot, "\r\n");

if (preg_match("/disallow:\s+\/\s*$/siU", $robot_check) || preg_match("/disallow:\s+\/$bn_url_link\s*/siU", $robot_check) || (preg_match("/disallow:\s+($dir_check)/siU", $robot_check) && !empty($dir_check))) {
$indexing.='Индексация страницы <a href="'.$url.'" target="_blank">страницы</a> запрещена в файле robots.txt! ';
}

$tmp=(strpos($contents, $needle)!==false);
$contents = preg_replace("/<!--(.*)-->/siU", '', $contents);
if ($tmp && (strpos($contents, $needle)===false))
$indexing.='Код '.$needle.' находится внутри комментария! ';

$tmp=(strpos($contents, $needle)!==false);
$contents = preg_replace("/<noindex>(.*)<\/noindex>/siU", '', $contents);
if ($tmp && (strpos($contents, $needle)===false))
$indexing.='Код '.$needle.' находится внутри тэга noindex! ';

$tmp=(strpos($contents, $needle)!==false);
$contents = preg_replace("/<nofollow>(.*)<\/nofollow>/siU", '', $contents);
if ($tmp && (strpos($contents, $needle)===false))
$indexing.='Код '.$needle.' находится внутри тэга nofollow! ';


return $indexing;
}
Антикризисное предложение: [Бурж, AdSense] [NEW] Сайты - каталоги компаний с гарантией трафа [Дорого] (/ru/forum/1006462)
CrewHS
На сайте с 05.08.2007
Offline
31
#2

if (strpos(preg_replace("/[\r\n]+/", " ", $contents), $needle) == false)
- ошибка в строке
У нас всегда можно добавить строительную фирму (http://lobzikov.ru/catg.html) бесплатно.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий