Скрипт парсинга беков через Yahoo + опред. тиц

weee
На сайте с 15.03.2010
Offline
33
643

Набросал простенький скриптик.

Что он делает?

1. Парсит ссылки с Yahoo (ограничение 1000 ссылок на сайт)

2. Каждый урл проверяет на тиц.

Скрин: http://prntscr.com/19b5t

<title>Проверка беков через Yahoo</title>

<form method="get" enctype="text/plain">
<input type="text" name="url" /><br />
<input type="submit" value="ok" />
</form>

<?php
/**
* @author weee
* @copyright 2010
*/

set_time_limit(0);
error_reporting(0);
$url = $_GET
$fileload = pars($url2[36], 'Export first 1000 results to <a href="',
'">TSV</a></li>');
$file = file($fileload);
unset($file[0]);
unset($file[1]);

foreach ($file as $file) {
$pattern = '/[ ]\d{1,7}[ text\/html]*/';
preg_match($pattern, $file, $matches);
$a = pars($file, 'http://', $matches[0]);
echo Tiz($a).' ';
echo $a . '<br>';
flush();
}
}
function pars($s, $a, $b)
{
$z = strpos($s, $a);
if ($z !== false) {
$z += strlen($a);
$y = strpos($s, $b);
if ($y !== false)
return substr($s, $z, $y - $z);
}
return 0;
}

function Tiz($Url)
{
$URI = parse_url($Url);
if (!$Domain = $URI['host'])
$Domain = $Url;
$Content = file_get_contents("http://bar-navig.yandex.ru/u?ver=2&url=" .
urlencode("http://" . $Domain) . "&show=1");
preg_match("/<tcy rang=\"(.*)\" value=\"(.*)\"\/>/isU", $Content, $cy);
return intval($cy[2]);
}
?>" title=";
if ($url) {
$url2 = file("http://siteexplorer.search.yahoo.com/search?p=$url&bwm=i&bwmo=d&bwmf=s");
$fileload = pars($url2[36], 'Export first 1000 results to <a href="',
'">TSV</a></li>');
$file = file($fileload);
unset($file[0]);
unset($file[1]);

foreach ($file as $file) {
$pattern = '/[ ]\d{1,7}[ text\/html]*/';
preg_match($pattern, $file, $matches);
$a = pars($file, 'http://', $matches[0]);
echo Tiz($a).' ';
echo $a . '<br>';
flush();
}
}
function pars($s, $a, $b)
{
$z = strpos($s, $a);
if ($z !== false) {
$z += strlen($a);
$y = strpos($s, $b);
if ($y !== false)
return substr($s, $z, $y - $z);
}
return 0;
}

function Tiz($Url)
{
$URI = parse_url($Url);
if (!$Domain = $URI['host'])
$Domain = $Url;
$Content = file_get_contents("http://bar-navig.yandex.ru/u?ver=2&url=" .
urlencode("http://" . $Domain) . "&show=1");
preg_match("/<tcy rang=\"(.*)\" value=\"(.*)\"\/>/isU", $Content, $cy);
return intval($cy[2]);
}
?>" target="_blank">;
if ($url) {
$url2 = file("http://siteexplorer.search.yahoo.com/search?p=$url&bwm=i&bwmo=d&bwmf=s");
$fileload = pars($url2[36], 'Export first 1000 results to <a href="',
'">TSV</a></li>');
$file = file($fileload);
unset($file[0]);
unset($file[1]);

foreach ($file as $file) {
$pattern = '/[ ]\d{1,7}[ text\/html]*/';
preg_match($pattern, $file, $matches);
$a = pars($file, 'http://', $matches[0]);
echo Tiz($a).' ';
echo $a . '<br>';
flush();
}
}
function pars($s, $a, $b)
{
$z = strpos($s, $a);
if ($z !== false) {
$z += strlen($a);
$y = strpos($s, $b);
if ($y !== false)
return substr($s, $z, $y - $z);
}
return 0;
}

function Tiz($Url)
{
$URI = parse_url($Url);
if (!$Domain = $URI['host'])
$Domain = $Url;
$Content = file_get_contents("http://bar-navig.yandex.ru/u?ver=2&url=" .
urlencode("http://" . $Domain) . "&show=1");
preg_match("/<tcy rang=\"(.*)\" value=\"(.*)\"\/>/isU", $Content, $cy);
return intval($cy[2]);
}
?>
LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#1

Туфта т.е. яху забанит как раз два такой IP на котором будет выполняться это.

Для этого у яху есть API вот через него пожайлуста.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/
weee
На сайте с 15.03.2010
Offline
33
#2

Меня при написании и отладке скрипта не ип забанило.

А вообщем хз, для личного пользования подойдет.

kolchakA
На сайте с 19.06.2010
Offline
226
#3
LEOnidUKG:
Туфта т.е. яху забанит как раз два такой IP на котором будет выполняться это.
Для этого у яху есть API вот через него пожайлуста.

ну если человек парсит не массово, то подойдет. Я сам как то писал подобный скрипт для личного пользования и все довольно долго функционировало без всякого бана.

Автоматизация для SEO : подключение API, пайпланы из нескольких сервисов, AI генерация контента

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий