Скрипт подсчета внешних ссылок.

12
humbert
На сайте с 16.03.2006
Offline
540
1841

Интересует скрипт подсчета внешних ссылок.

Есть у кого?

Парсинг прайс-листов, наполнение интернет-магазина товаром. (https://humbert.ru) Любая CMS (Битрикс, OpenCart, Prestashop и даже Woo Commerce )
topol-m
На сайте с 29.08.2005
Offline
21
#1

  


// получем ссылки в массив
preg_match_all("/<[Aa][ \r\n\t]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ '\"\n\r\t]*([^ \"'>\r\n\t#]+)[^>]*>/",$contents,$url);

Как в переменную contents загнать содержимое анализируемой морды , и что делать потом с массивом ссылок, думаю придумать не сложно

Код на PHP

С уважением, topol CODECO (http://www.codeco.ru/promo/)
Klopopryg
На сайте с 29.12.2004
Offline
344
#2
topol-m:
  


// получем ссылки в массив
preg_match_all("/<[Aa][ \r\n\t]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ '\"\n\r\t]*([^ \"'>\r\n\t#]+)[^>]*>/",$contents,$url);



Как в переменную contents загнать содержимое анализируемой морды , и что делать потом с массивом ссылок, думаю придумать не сложно
Код на PHP

А можно сделать, чтобы только морды подсчитывал?

Лучше выстрелить, перезарядить и еще раз выстрелить, чем светить фонариком и спрашивать - "кто тут?"
Коля Дубр
На сайте с 02.03.2005
Offline
153
#3
Klopopryg:
А можно сделать, чтобы только морды подсчитывал?

Урл ссылки в приведенном примере описывается вот этим куском регекспа:

([^ \"'>\r\n\t#]+)

Сюда надо вставить правило для морд. Здесь же, кстати, можно сделать, чтоб собирались только внешние ссылки, а не все подряд =)

humbert, вы уточнили бы, вам подсчет внешних входящих, или внешних исходящих надо? Грубый подсчет исходящих есть у меня в подписи (если у вас правильный браузер =)) Грубый подсчет входящих умеет делать яндекс =)

Разрабатываю общую шину (http://habrahabr.ru/company/floxim/blog/268467/) помаленьку. ...а еще у меня есть бложек (http://www.blogovo.ru/).
humbert
На сайте с 16.03.2006
Offline
540
#4

мне надо скрипт для своего сайта. Т.е. ни Яндекс ни сторонний сайт не подойдет.

Принцип такой, вводится урл странички сайта, и мой скрипт определяет сколько стоит внешних ссылок на этой страничке.

topol-m, спасибо за функцию, посмотрим.

Kolyaj
На сайте с 28.03.2006
Offline
69
#5
topol-m:
PHP код:
// получем ссылки в массив
preg_match_all("/<[Aa][ \r\n\t]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ '\"\n\r\t]*([^ \"'>\r\n\t#]+)[^>]*>/",$contents,$url);

Как в переменную contents загнать содержимое анализируемой морды , и что делать потом с массивом ссылок, думаю придумать не сложно
Код на PHP

Только не забудьте перед этим вырезать из странички комментарии и скрипты.

M
На сайте с 28.02.2006
Offline
236
#6

А как скриптом получить число внешних ссылок? Не нужны сами ссылки, только количество.

humbert
На сайте с 16.03.2006
Offline
540
#7

mihas, надо просто подсчитать в массиве их количество.

С регулярками у меня туго, пойду учить

humbert
На сайте с 16.03.2006
Offline
540
#8

не могу никак собрать только внешние ссылки, поможите, плизз.

Отличие внешних ссылок это http:// и другой домен, т.е. есть домен site.ru

ссылки типа

1. href=/sffsdfsd.html

2. href=http://site.ru/1.html

не являются внешними.

а href=http://poddomen.site.ru/1.html - внешняя ссылка.

Не могу правила придумать, Хелп нид.

Этот скрипт выводит все ссылки с http://

preg_match_all("/<[Aa][ \r\n\t]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ '\"\n\r\t]*[Hh][Tt][Tt][Pp][\:\/\/]*([^ \"'>\r\n\t#]+)[^>]*>/",$contents,$url);

Одним preg_match_all бы все вывести. Пока не получается

G2
На сайте с 19.10.2006
Offline
0
#9

Humbert.

Меня эта тема тоже интересует, нашел может еще что-нибудь интересное , скрипты или куски кода, я мог бы доделать в нормальное состояние

humbert
На сайте с 16.03.2006
Offline
540
#10

gall2006, да не, больше пока не искал.

Помоги с кодом, нужно верхний код доработать, чтобы все внешние ссылки выдавал

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий