Как найти текст?

L
На сайте с 28.02.2006
Offline
132
340

Короче задача: Есть текст($orig) с тэгами, ссылками, спецсимволами произвольной длинны....

надо найти в другом тексте($subject), в котором тоже есть всякие символы, слова и ссылки из $orig. Причем, между словами могут быть еще тэги и спецсимволы. Последовательность слов и ссылок при этом не меняется.

Пример:

$orig="текст1<p>текст2 текст3 текст4 текст5";

$subject="текст1 текст2<br>текст3<br>текст4 текст5";

Как мне сравнить их, чтобы несмотря на разные тэги я смог найти весь текст нужный?

ЗЫ. $subject="текст2 текст1<br>текст3<br>текст4 текст5"; - а вот это уже неправильный вариант

Shtogrin
На сайте с 02.11.2006
Offline
95
#1

//удалить теги

$data=strip_tags($data);
//спецсимволов много разных?
$data=str_replace(array('&nbsp;'),array(' '),$data);
//заменить множественные пробелы на один
$data=preg_replace("/\s+/m"," ",$data);
//уберем пробелы по бокам
$data=trim($data);

После этого у вас должен остаться чистый текст, в котором слова разделены одним пробелом. Дальше сравнивайте или ищите одну строку во второй.

www.shtogrin.com (http://www.shtogrin.com/). Канцтовары (http://www.invit.com.ua/). 1С Бухгалтерия (http://account.kiev.ua/).
L
На сайте с 28.02.2006
Offline
132
#2

Спасибо! Сообразил.... я просто пытался в одной функции это реализовать... туплю под утро

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий