Регуляркой вытащить "тэг"

=Lexx=
На сайте с 14.01.2009
Offline
117
748

Помогите регулярными выражениями вытащить "тэги":

культура

питер

Язык - php


<div class="asset-tags"><h4 class="asset-tags-header page-header-4">Tags:</h4>
<ul class="asset-tags-list">
<li class="item"><a rel="tag" href="http://ЖЖюзер.livejournal.com/tag/%D0%BA%D1%83%D0%BB%D1%8C%D1%82%D1%83%D1%80%D0%B0">культура</a>, </li><li class="item"><a rel="tag" href="http://ЖЖюзер.livejournal.com/tag/%D0%BF%D0%B8%D1%82%D0%B5%D1%80">питер</a></li>
</ul>
</div>
[umka]
На сайте с 25.05.2008
Offline
456
#1

if (preg_match_all("#livejournal.com/tag/[^>]+>([^<+])</a>#",$data,$regs)) {

print_r($regs);
}
Лог в помощь!
=Lexx=
На сайте с 14.01.2009
Offline
117
#2
'[umka:
;8701579']
if (preg_match_all("#livejournal.com/tag/[^>]+>([^<+])</a>#",$data,$regs)) {

print_r($regs);
}

не выходит :(((

http://seo-storm.ru/regexp/

[umka]
На сайте с 25.05.2008
Offline
456
#3

Сорри, пальцы в кнопках запутались

if (preg_match_all("#livejournal.com/tag/[^>]+>([^<]+)</a>#",$data,$regs)) { 

print_r($regs);
}
A
На сайте с 04.03.2011
Offline
20
#4

вместо [^<+] напишите [^<]+

=Lexx=
На сайте с 14.01.2009
Offline
117
#5
'[umka:
;8701720']Сорри, пальцы в кнопках запутались
if (preg_match_all("#livejournal.com/tag/[^>]+>([^<]+)</a>#",$data,$regs)) { 

print_r($regs);
}

Так работает, но вытаскиваются все "тэги" со страницы. Как ограничить только тэгами к данной записи?

В верхней textarea содержимое $data

http://seo-storm.ru/regexp/

http://seo-storm.ru/regexp/example.html

[umka]
На сайте с 25.05.2008
Offline
456
#6

if (preg_match_all('#<a rel="tag"[^>]+>([^<]+)</a>#',$data,$regs)) {  
print_r($regs);
}
A
На сайте с 04.03.2011
Offline
20
#7
=Lexx=:
Как ограничить только тэгами к данной записи?

надо вставить в regexp ограничитель данной записи, который, на самом деле, зависит от используемого в жж шаблона.

а Вам точно надо парсить жж, там же по идее какой-то rss-фид должен быть, может быть даже с тэгами?

=Lexx=
На сайте с 14.01.2009
Offline
117
#8

Спасибо, с помощью [umka] разобрался.

рсс-фида, к сожалению уже нет.

так что заодно и в пхп тренируюсь, с парсерами разбираюсь.

A
На сайте с 04.03.2011
Offline
20
#9
=Lexx=:
рсс-фида, к сожалению уже нет.

Вы парсите html из web.archive.org? :)

Если нет - надо к имени существующего журнала дописать /data/rss и парсить это...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий