Парсер HTML библиотека

Жорик
На сайте с 11.09.2006
Offline
168
197
Приветствую!

1) Есть для пыха либа парсинга HTML? Меня конкретно интересует получить все узлы, а точнее содержащийся в них текст, модифицировать и собрать страницу обратно. Можно модифицировать выбирая последовательно каждый текстовый "кусок".

phpQuery вроде что надо, но она не устарела?

2) Существуют ли для пыха либа-валидатор HTML?

P.S.: В пыхе есть встроенные классы для DOM, но они какие-то мутные. И разбираться нет сейчас времени (оно того стоит?)
XruMan
На сайте с 11.02.2011
Offline
103
#1
Ещё есть Nokogiri - https://github.com/olamedia/nokogiri/
GitHub - olamedia/nokogiri: HTML parser for PHP - Парсер HTML
GitHub - olamedia/nokogiri: HTML parser for PHP - Парсер HTML
  • olamedia
  • github.com
Attention: New version can break compatibility, in that case use previous version under the v1.0 branch or tag which supports even php 5.4+ This library is a fast HTML parser, which can work with invalid code (errors are ignored). Under the hood is used LibXML. As the input you can use HTML string in UTF-8 encoding or DOMDocument. For the...
lutskboy
На сайте с 22.11.2013
Offline
172
#2
я сколько делал парсеров решал все на DOM xpath
Жорик
На сайте с 11.09.2006
Offline
168
#3
lutskboy #:
я сколько делал парсеров решал все на DOM xpath

Это же для XML, там проблемки как я понял будут с невалидным кодом.

XruMan #:
Ещё есть Nokogiri

А как у неё с документацией? Я имею ввиду качество.

Жорик
На сайте с 11.09.2006
Offline
168
#4

Еще нагуглил PHP Simple HTML DOM Parser - у них как я вижу отличная (и по отзывам) документация.

Не знаю, решит ли мою проблему это - извлечь все узлы, обойти и что-то модифицировать и сохранить обратно в HTML... 🤸

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий