- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Подскажите, есть XML rss ка , которая генерится с ошибками ( спецсимволы не конвертируются), тоесть выдается & вместо & и т.д. Стандартные XML парсеры PHP типа Simple XML не могут запарсить данный файл и выдают сообщение об ошибках. Можно ли как-то переконвертить его в нормальный формат? Пока вижу только вариант замены через регулярку отдельных символов, но помоему это не очень хорошее решение.
Спасибо за советы заранее.
Пример проверки рсс
http://validator.w3.org/feed/check.cgi?url=http://www.warriorplus.com/wso/rss/
Семантика не нарушена? Могу посоветовать http://htmlpurifier.org/. Думаю, XML он вполне съест.
Используй Tidy - вроде с xml работает...
aktuba добавил 13.06.2011 в 21:39
Семантика не нарушена? Могу посоветовать http://htmlpurifier.org/. Думаю, XML он вполне съест.
Насколько помню, htmlpurifier вообще для другого и работает именно с html-тегами.
когда имеется возможность, можно прогонять через Tidy, когда нет, можно попробовать пляски с DomDocument::loadHTMLFile, ну и регулярки, если нет другого выхода
Я бы попробовал ему скормить XML как фрагмент HTML, и добавить нужные элементы в исключение. В него кстати Tidy встроен.
5 минут и вопрос решен.
Ваша проблема вот где:
Символы � вводят SimpleXML в ступор.
Расступорить его проще простого.
Лекарство в студии (протестировано ;) ):
Занавес 🍿