Форматирование RSS средствами php

12
Segey
На сайте с 23.08.2005
Offline
404
908

В общем речь о самом просто документе, например, вот таком

В браузере без помощи чего либо становится не читаемым. Ну то есть можно конечно, но там куча тегов. Мне же нужно его сделать как читаемый документ, чтобы заголовки стали подобны h1 и так далее.

Но не хочется все вручную делать, потому что дизайн вообще не имеет значения. Просто прочитать надо, а под рукой php... Как бы это быстро просто и удобно сделать? В итоге он будет на самостоятельной странице, отдельно от всего просто для беглого просмотра/чтения.

Brexit - уже совсем рядом. (https://about-this-model.blogspot.com/2019/03/brexit.html)
S
На сайте с 30.09.2016
Offline
469
#1

Это называется парсер RSS.

Отпилю лишнее, прикручу нужное, выправлю кривое. Вытравлю вредителей.
Segey
На сайте с 23.08.2005
Offline
404
#2

Не видать там XML(RSS) -> HTML/PDF/еще что-то подобное

S
На сайте с 30.09.2016
Offline
469
#3
Segey:
Не видать там XML(RSS) -> HTML/PDF/еще что-то подобное

Для этого надо попробовать перейти по тем ссылкам, что даёт Гугл. Делается это очень просто: курсор мышки наводится на ссылку, после чего нажимается левая кнопка мыши. И вуаля - Вы переходите на сайт с информацией.

totamon
На сайте с 12.05.2007
Offline
437
#4
Segey:
В браузере без помощи чего либо становится не читаемым.

хром, фирефокс и опера нормально показывают RSS, вполне читабельно...

Segey:
под рукой php...

и зачем дело встало? открываете блокнот и пишите парсер RSS, или копи-пастите из одной из статей найденных в гугле☝

Домены и хостинг https://8fn.ru/regru | Дедик от 3000р https://8fn.ru/73 | VPS в Москве https://8fn.ru/72 | Лучшие ВПС, ТП огонь, все страны! https://8fn.ru/inferno | ХОСТИНГ №1 РОССИИ https://8fn.ru/beget
Segey
На сайте с 23.08.2005
Offline
404
#5

Парсер = получить. Но тот же SimpleXML остановился на этом и далее не развивался. Вероятно дело в названии и нужно все таки что-то для форматрирования. О чем я кстати и спрашивал.

S
На сайте с 30.09.2016
Offline
469
#6

Что-то для форматирования Вы сами задаёте. Парсер выдаёт структурированный объект. который Вы выводите на экран в соответствии с Вашими желаниями.

А если это надо не на сайт, а лично для себя - тогда проще подобрать браузер, который это покажет в читабельном виде. Например, IE8 читает и показывает нормально. :) Вот например сейчас в Файерфоксе я это вижу так

jpg capture_28092018_140355.jpg
M
На сайте с 04.12.2013
Offline
223
#7

Segey, ну добавьте свое HTML-представление вместо RSS-. В чем конкретно проблема?

---------- Добавлено 28.09.2018 в 15:58 ----------

Вы вообще спрашиваете про ленту своего сайта или чужого?

Домены и скрипт для коротких ссылок: https://u75.ru/domains-for-shortcuts
Segey
На сайте с 23.08.2005
Offline
404
#8

miketomlin, Sitealert,

Да, как в FF например, но только так чтобы в пару функций это сделать. И лента не моего сайта, лента другого сайта. Просто я получил ее через curl как страницу. Выглядит она плохо, а возится и перебирать все теги RSS и еще иметь проблемы с валидностью не очень хочется. Вот то как в FF это выглядит, очень удобно - только средствами php а не браузера, неохота городить огород.

Задачка то совсем простенькая сама по себе....

M
На сайте с 04.12.2013
Offline
223
#9

В общем случае не такая уж и простенькая, т.к. форматы могут быть разные и т.п. Но для конкретного сайта подобрать подходящий парсер, думаю, будет несложно.

---------- Добавлено 28.09.2018 в 16:43 ----------

Что вам мешает использовать FF и т.п.? Или все же основная задаче не в удобстве собственного чтения, а именно в самом парсинге :)

Segey
На сайте с 23.08.2005
Offline
404
#10

miketomlin, Тут без разницы какой сайт, все просто на чистую страницу. Вроде как версия для печати. А FF я не хочу, потому что у меня "G", а так же я остановился в момент:

$full_rss_page_content;

// Что-то надо делать...
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий