Так и не победил я эту сущность :)
Написал:
@remove:$body//p[not(contains(text()," ")) and not(*)]
Для текущей задачи сгодилось, не может же быть статьи без пробелов.
Оно именно " " не находит, простой текст находит, видимо " " как-то по другому написать нужно.
Пробовал replace(" ","") не заменяет
А как найти элемент содержащий только пробелы и <br>?
//p[not(text())] совсем без текста находит (<p ></p>)
//p[text()=" "] такое уже не находит (<p > </p>)
В идеале хотелось бы найти такое безобразие:
<p> <br> <br> <br><br><br><br><br><br><br><br><br><br><br></p>
https://developers.facebook.com/tools/debug/sharing/?q=http%3A%2F%2Fwww.motorroar.ru%2Fnews%2Fnovelty%2Ffull%2F13194%2F
Фейсбук 404 код получает, Вконтакте видимо тоже
2 запроса я могу сделать, но мне нужно в одном написать, т.к. условий будет много и если я понадобится поменять "123" на "123 or 456" мне это в двух местах придётся менять.
<body> <p>55555</p> <div>555555555</div> <p><span>123</span></p> <p> </p> <p> </p> <p>66666 <p> </p> <p>444444</p> <div><p>333</p></div> </body>
Получить нужно:
<p><span>123</span></p> <p> </p> <p> </p> <p>66666 <p> </p> <p>444444</p> <div><p>333</p></div>
...что за огород должен быть что-бы 3 недели картошку сажать. Гектар как минимум :)
3 недели? Может он его всё таки не зарегистрировал снова, а успел продлить?
С Яндексом понятно, а аналог Гугла вам на кой? Аналог Вконтакта пишите и Касперского.