Регулярки на пхп

J
На сайте с 08.06.2006
Offline
844
5520

Подскажите регулярку на пхп, чтобы выдернуть из нтмл страницы все внутрении ссылки.

Спасибо!

I
На сайте с 29.04.2006
Offline
135
#1

$pattern = "/<[Aa][ \r\n\t]{1}[^>]*[Hh][Rr][Ee][Ff][^=]*=[ '\"\n\r\t]*([^ \"'>\r\n\t#]+)[^>]*>/";
dkameleon
На сайте с 09.12.2005
Offline
386
#2
ipconfig:
[Hh][Rr][Ee][Ff]

это делается модификатором "i" после регулярки :)

Дизайн интерьера (http://balabukha.com/)
J
На сайте с 08.06.2006
Offline
844
#3

а попроще никак?

K
На сайте с 12.07.2006
Offline
295
Kpd
#4
joost:
а попроще никак?

А куда проще? можно чуть сократить запись

$pattern = "#<a\s+[^>]*href\s*=['\"\s]*([^\"'>\s\#]+)[^>]*>#i"

но смысл не изменится

З.Ы. Странно что за 3 года на форуме не научился выбирать раздел для нового топика.

ewg777
На сайте с 04.06.2007
Offline
225
#5
Странно что за 3 года на форуме не научился выбирать раздел для нового топика.

Разве только этому? А название темы?

LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#6

Не хотите на пхп... можете руками через JS


javascript:all=document.links.length;mass='<b>Всего ссылок на странице:\u0020'+all+'</b><br><br>\n';for(i=0;i<all;i++){mass+=document.links+'<br>\n';}newwind=window.open('about:blank','result','width=600,top=100,left=100,scrollbars=1');newwind.document.write(mass);
✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/
Linkpusher
На сайте с 28.12.2007
Offline
176
#7

Kpd, ipconfig, в регулярке одной фичи не хватает:

joost:
внутрении ссылки

:)

В cookbook-е есть вполне рабочий рецепт.

joost:
а попроще никак?

Вот уж вряд ли.

Точу ножи. Буквально. Есть отзывы. Заказать заточку в МСК и Подольске можно через Телеграмм.
sowich
На сайте с 11.06.2007
Offline
26
#8

exit..............

Мой блог (http://sowich.info) Пишу скрипты на php, perl - велком!
J
На сайте с 08.06.2006
Offline
844
#9

Надо выдернуть все внутрении урлы.

Допустим есть на странице урлы вида Код:

<a href=page.php>
<a title=page href=page.php>
<a href = page.php>
<a href="page.php">
<a href='page.php'>
<a href=http://site.com/page.php>
<a href=http://www.site.com/page.php>
<a href=http://site.com/page.php target=_blank>

надо выдернуть page.php

делаю такую регулярку PHP:

preg_match_all("/<a.*href\s+?=\s+?['\"]?(?:http:\/\/(?:www.)?)?(.*)['\"]?\s+|>/isU",$page,$urls);

в ответ пусто

ну что же не так сделал?

K
На сайте с 12.07.2006
Offline
295
Kpd
#10

joost, RTFM

\s+? - это клиника.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий