XPATH текущий элемент и ниже

12
S
На сайте с 30.09.2016
Offline
469
#11

Что естественно, потому что xml на   в принципе ругается нехорошими словами. Как-то парсил RSS, в которых попадались подобные сущности, приходилось предварительно заменять их на аналогичные (типа & #160; ).

Отпилю лишнее, прикручу нужное, выправлю кривое. Вытравлю вредителей.
Samail
На сайте с 10.05.2007
Offline
361
#12

Так и не победил я эту сущность :)

Написал:

@remove:$body//p[not(contains(text()," ")) and not(*)]

Для текущей задачи сгодилось, не может же быть статьи без пробелов.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий