Регулярки на пхп

[Удален]
#31
Bitman:
preg_match_all("#href[\s]*=[\s]*\\\?\"?'?(.*?)\\\?[\"'\s]#is",$content,$href_array);

сожрет до кучи <link ...

bearman добавил 24.07.2009 в 00:54

не считая того, что [\s]* минимум ... хз даже как сказать что это

Bitman
На сайте с 05.07.2009
Offline
112
#32

вот так тогда, предусмотрено вроде как всё что можно

preg_match_all("#<a[\s].*?href[\s]*=[\s]*\\\?\"?'?(.*?)\\\?[\"'\s>]#is",$content,$href_array);

Северный лес (https://euro-vagonka.by) DREW (https://drew.by) AvtoDrive (https://avtodrive.by)
[Удален]
#33
Bitman:
вот так тогда, предусмотрено вроде как всё что можно
preg_match_all("#<a[\s].*?href[\s]*=[\s]*\\\?\"?'?(.*?)\\\?[\"'\s>]#is",$content,$href_array);

ошибка(сейчас недочет, но бывает это ошибкой, причем страшной) как у jumash :) объяснение можете найти на предыдущ странице

Bitman
На сайте с 05.07.2009
Offline
112
#34

сомневаюсь что я выйду за пределы <a> если об этом

но [^>] тоже неплохо

[Удален]
#35
Bitman:
сомневаюсь что я выйду за пределы <a> если об этом
но [^>] тоже неплохо

проверьте и сомнения пропадут :) для проверки можете мой кусок хтмл использовать который там в посте был :)

Bitman
На сайте с 05.07.2009
Offline
112
#36

пожалуй соглашусь. но моментов в возможной невалидности еще куча

например, <a sukahref="otsoso" href="http://tut.by"> :)

[Удален]
#37
Bitman:
пожалуй соглашусь. но моментов в возможной невалидности еще куча
например, <a sukahref="otsoso" href="http://tut.by"> :)

<a[^>]* href\s*=\s*(\S+)[\s>]

ну и кавычки поотрезать если попадтся

;)

Bitman
На сайте с 05.07.2009
Offline
112
#38

ночная головоломка для специалистов

<a sukahref="otsoso href=http://google.com href='http://yandex.ru' " href="http://tut.by">

п.с. Браузеры такое понимают правильно

[Удален]
#39

интересная тема для рассуждений. да, в таком случае я бы посоветовал посильнее анализировать, делать парсер тегов и тп, мой класс DudeForm тоже это дело разгребает как плюнуть ))))) помню писал такой парсер, а то быдлокодеры такой хтмл любят генерить ... ой ой ой ..

ну там просто анализ по всем тегам проходит, "выдрать" кусок не получится, надо знать что до куску и после куска)

J
На сайте с 08.06.2006
Offline
844
#40
bearman:
[^>]

что значить это?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий