pHp регулярные выражения

[Удален]

12 апреля 2014, 21:21

1766

Здравствуйте. Столкнулся с такой проблемой. Есть такое выражение:

preg_match_all('#<span class="name">(.+?)</span>#is', $m1, $m2);

Получается оно ищет всю инфу что заключена в тег <span class="name">, но так получилось что внутри этого тега есть ещё ссылка (тег <a>) и в итоге я получаю код вида:

<a href="ссылка" title="Название">Текст</a>

Но мне мне нужно получить просто текст, который содержится в этой ссылке.

Подскажите как можно получить именно текст ?)

427

siv1987

12 апреля 2014, 22:23

#1

$i - условный счетчик

strip_tags($m2[$i][1]);

[Удален]

13 апреля 2014, 10:32

#2

tohenson:
Здравствуйте. Столкнулся с такой проблемой. Есть такое выражение:

preg_match_all('#<span class="name">(.+?)</span>#is', $m1, $m2);

Получается оно ищет всю инфу что заключена в тег <span class="name">, но так получилось что внутри этого тега есть ещё ссылка (тег <a>) и в итоге я получаю код вида:

<a href="ссылка" title="Название">Текст</a>

Но мне мне нужно получить просто текст, который содержится в этой ссылке.
Подскажите как можно получить именно текст ?)

Ссылка всегда присутствует внутри span или когда как?

[Удален]

25 апреля 2014, 20:24

#3

siv1987:
$i - условный счетчик
strip_tags($m2[$i][1]);

Спасибо, то что надо.

Столкнулся с новой проблемой, мне нужно вытащить содержимое из таблицы, включая все теги в этой таблице (<td><th> и т.д.), таблица имеет такой вид:

<table class="class sort {list: [[9,1]]}">
Содержимое
</table>

Подскажите, какое должно быть регулярное выражения, чтобы вытащить содержимое этой таблицы. Ибо пишу preg_match_all('/<table class="class sort {list: [[9,1]]}">(.*)<\/table>/', $t, $g); и нефига)

регулярные выражения Разбор переменной Релевантность слов в таблицах

С

51

Стрихар

25 апреля 2014, 20:29

#4

tohenson:
Спасибо, то что надо.

Столкнулся с новой проблемой, мне нужно вытащить содержимое из таблицы, включая все теги в этой таблице (<td><th> и т.д.), таблица имеет такой вид:
<table class="class sort {list: [[9,1]]}">
Содержимое
</table>
Подскажите, какое должно быть регулярное выражения, чтобы вытащить содержимое этой таблицы. Ибо пишу preg_match_all('/<table class="class sort {list: [[9,1]]}">(.*)<\/table>/', $t, $g); и нефига)

Может имеет смысл посмотреть в сторону какого-нибудь nokogiri?

J

120

jkm

25 апреля 2014, 20:34

#5

tohenson, а квадратные скобки кто за вас экранировать будет.

67

forest25

25 апреля 2014, 21:14

#6

ТС, то что вы начали с регулярок конечно очень хорошо, но впоследствие на каждый новый участок кода вам придется сочинять новые регулярки (хотя плюс тут очевиден, в регулярках будете мастером =)), но если нужно что-то быстро спарсить советую вам библиотеку phpQuery.

Парсить можно прямо по css-селекторам + куча фич портированых из jQuery.

Единственно что - крупные участки кода лучше сперва делить на фрагменты и парсить отдельно.

VPS 512MB 20GB SSD KVM - 5$ (http://u.hmdw.me/digitalocean) | ИМХО о хостингах (http://u.hmdw.me/hosting)

В Google Фото появились Google ответил на вопрос Что такое дорожный граф

427

siv1987

25 апреля 2014, 23:15

#7

preg_match('/<table class="class sort \{list: \[\[9,1\]\]\}">(.*)<\/table>/s', $t, $g);

[Удален]

26 апреля 2014, 13:56

#8

Ребят, большое спасибо всем, особенно вам siv1987. Плюсы кинул :)

427

siv1987

26 апреля 2014, 15:02

#9

(.*)<\/table> заменить на (.*?)<\/table>

187

SEO-MAN

24 мая 2014, 19:57

#10

А у меня такая проблема.

Хочу в регулярку загнать:

<div class="class1">Цитата:<div class="class2"><blockquote>текст цитаты</blockquote></div> нужный текст</div>
</td>

class2 встречается не всегда..

На выходе preg_match хочу получить:

Цитата: текст цитаты
<br>
нужный текст

Пока хватило на

$str_repl=array("\n");

$m1 = str_replace($str_repl,"",$m1);

preg_match_all('#<div class="class1">(.+?)</div></td>#is', $m1, $m2);

Потом уже в $m2 делаю strip_tags исключая blockquote

Форум сео (http://forum-seo.net) для новичков автоматическая регистрация в 30000 каталогах за 5$ (/ru/forum/157861) Нужна доработка 2 досок объявлений - avtopmr.net, pmrdom.com (вип объявления и удаление дублей)

Див верстка PandoraBox - новый дорген. Дорген PandoraBox - вопросы

Google: E-E-A-T не является фактором ранжирования

Маркетинг для шоколадной фабрики. На 34% выше средний чек