Скрипт на php для проверки ВС

12
Fi9hter
На сайте с 05.08.2008
Offline
205
1071

Погуглил, не нашел что-то. Есть у кого скрипт на пхп для проверки страницы на кол-во внешних ссылок? Там по сути довольно много проверять и муторно насколько я понимаю, потому что побайтно бегать и искать в странице тег и проверять его на то внешний он или нет.

[Удален]
#1

........................

F
На сайте с 12.09.2003
Offline
120
#2

выдернул регуляркой ссылки со страницы.

посчитал те, что содержат в себе имя домена отличного от $_SERVER['HTTP_HOST']

D
На сайте с 09.07.2009
Offline
79
#3

<?php
$url='url.com/ppp.html';
$out=file_get_contents($url);
preg_match_all('/<a href="(.*)">/', $out, $regs);
$k=count($regs[1]);
$j=0;
for($i=0; $i<$k; $i++)
{
if(!strpos($regs[1][$i],"url.com"))
$j=$j+1;
}
echo $j;

?>

набросал за минуту..

не тестил.

дорабатывать надо конечн..

скрипт не учитывает ссылки вида /ddd/hjnm.html которые будут не внешними

[Удален]
#4

недавно писал подобный скрипт (чуть недоработал, так как праздники отвлекли))). Обработку ссылок вида /ddd/hjnm.html нужно добавлять обязательно, так как для оценки внешек всего сайта вам нужно не только парсить ссылки со страницы, но и переходить по ним. Думаю, через недельку скрипт доделаю и выложу на своем блоге в виде бесплатного онлайн сервиса. ТС, если скрипт вам очень нужен, стукните в личку - как доделаю вышлю.

digwnews:
<?php

$url='url.com/ppp.html';
$out=file_get_contents($url);
preg_match_all('/<a href="(.*)">/', $out, $regs);
$k=count($regs[1]);
$j=0;
for($i=0; $i<$k; $i++)
{
if(!strpos($regs[1][$i],"url.com"))
$j=$j+1;
}
echo $j;

?>

набросал за минуту..
не тестил.
дорабатывать надо конечн..
скрипт не учитывает ссылки вида /ddd/hjnm.html которые будут не внешними
S
На сайте с 12.11.2009
Offline
13
#5

если задача стоит быстро определить кол-во внешних ссылок на какой-либо странице, имхо удобнее юзать этот аддон к Файерфоксу

Fi9hter
На сайте с 05.08.2008
Offline
205
#6
snatch:
если задача стоит быстро определить кол-во внешних ссылок на какой-либо странице, имхо удобнее юзать этот аддон к Файерфоксу

Все автоматизировано должно быть, поэтому должен быть скрипт у меня. Пишу систему типа сеопульта.

Seredniy
На сайте с 17.03.2008
Offline
251
#7
Fi9hter:
Все автоматизировано должно быть, поэтому должен быть скрипт у меня. Пишу систему типа сеопульта.

будет интересно глянуть. или не паблик?

Wordpress и другие CMS: правки, настройка, верстка и натяжка шаблонов, разработка сайтов "под ключ" (/ru/forum/1008050)
Fi9hter
На сайте с 05.08.2008
Offline
205
#8
Seredniy:
будет интересно глянуть. или не паблик?

Пока если честно не знаю, я решил что это будет тема моей дипломной, которую сдавать через полгода и по сути этим убиваю 2 зайца. 1) Буду экономить время которое трачу на покупку ссылок в бирже. 2) Пишу очень интересный диплом.

Socionics
На сайте с 17.06.2006
Offline
209
#9

Работающая версия у кого-нибудь есть?

D
На сайте с 09.07.2009
Offline
79
#10

Действительно проблемная вещь..

Быть может кто-то хотя бы алгоритм подбросит?

Вот написал новую версию, но она работает не со всеми сайтами..

<?php
$url='http://yandex.ru';
preg_match_all('/(http:\/\/?[^\/]+\/)/i',$url, $regs1);
$out=file_get_contents($url);
preg_match_all('/<a href="(.*)">/', $out, $regs);
$k=count($regs[1]);
$j=0;
for($i=0; $i<$k; $i++)
{
if(strpos($regs[1][$i],$regs1[1][0])===false && strpos($regs[1][$i], "http://")===true)
$j=$j+1;

}
echo $j;

?>
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий