Автоматическое выделение основного содержимого на странице

B
На сайте с 23.10.2006
Offline
170
907

Требуется программа/php скрипт для автоматического выделения данных из html документа

Нашел бесплатный сервис

https://mercury.postlight.com/web-parser/

работает отлично через API (медленно), но только с UTF8 кодировкой :(

Встречал ли кто не онлайн решение - чтобы можно было установить на хостинг?

B
На сайте с 23.10.2006
Offline
170
#1
Lucrezia:
content downloader / x-parser

первый умеет вытаскивать контент только после разметки искомых тегов, а второй - делает это не особо лучше удаления -всех измененных блоков после повторной загрузки + удаления всех ссылок из html документа, а если учесть что спотыкается на топиках форумов - то вообще грустно.

Так что поиски продолжаются

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий