Получение всех внутренних ссылок со страницы (в том числе и относительных).

[Удален]
649

Написал функцию для получения всех внутренних ссылок со страницы, заданных абсолютным путем:


$parsedUrl=parse_url($url);
$host=$parsedUrl['host'];

preg_match_all('/<a([^<]*?)href=[\'"](http:\/\/(www\.)?'.$host.'[^\'"]*?)[\'"]/i',$html,$matches);

В принципе, догадываюсь как сделать регулярное выражение и для получения ссылок с относительным путем, но уж больно не хочется где-нибудь чего-нибудь не учесть. Может у кого-то есть готовое решение? Кстати, посмотрите, плз, и эту функцию, может в ней есть какие недоработки.

[umka]
На сайте с 25.05.2008
Offline
456
#1

Относительный путь — это любой путь, в котором

/^(^[a-z]+\:\/\/)/i

Лог в помощь!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий