Пропадают пробелы при перекодировании текста

125

alarm

30 ноября 2010, 15:44

1378

Парсю RSS-файл, отдающийся в UTF-8, перекодирую с помощью iconv в 1251 - на выходе текст без пробелов. Вернее часть пробелов все же остается - между знаками препинания и текстом, между цифрами и текстом, а между словами пропадают. В чем хитрость, кто подскажет? А то не кодер я совсем.

Только те, кто предпринимают абсурдные попытки, смогут достичь невозможного.

456

[umka]

30 ноября 2010, 16:01

#1

а в самом файле пробелы на месте?

Лог в помощь!

A

125

alarm

1 декабря 2010, 09:29

#2

[umka], да, в самом файле на месте. Собственно, сам файл - это рсс-лента микроблога в твиттере.

456

[umka]

1 декабря 2010, 10:51

#3

тут только два варианта:

или всё-таки кривые данные на входе

или глючный iconv на сервере

[umka] добавил 01.12.2010 в 13:55

кстати, если rss идёт xml-файлом, и там в нём указана кодировка (например: <?xml version="1.0" encoding="utf-8"?>), а вы берёте, да и конвертируете файл в cp1251 с помощью iconv, то перед тем, как парсить xml, необходимо параметр encoding заменить.

Google предлагает использовать карты В API 5 Директа Становится ли веб-мастер в

A

125

alarm

1 декабря 2010, 13:23

#4

[umka], я меняю не кодировку файла, а кодировку выводимой строки. На самом деле, сейчас я обратил внимание, что проблема возникает еще до этапа перекодировки - при парсинге. Я использую XML Parser Functions.

456

[umka]

1 декабря 2010, 13:30

#5

Стало быть, первый вариант :) "или всё-таки кривые данные на входе"

A

125

alarm

1 декабря 2010, 14:11

#6

Воспользовался SimpleXML, проблема исчезла. [umka], спасибо за участие=)

169

Ёхан Палыч

1 декабря 2010, 14:23

#7

alarm:
сам файл - это рсс-лента микроблога в твиттере

Есть такая бага в связке апи твиттера и XML Parser.

Лечится XML_OPTION_SKIP_WHITE ставится в 0, правда могут возникнуть ошибки с пустыми строками, поэтому сначала надо создать DOMDocument без пробелов между тэгами.

Рабочий пример:

function xmlParser($xmlData){

    $returnValue = array();

    if(!is_array($xmlData)){

        $dom = new DOMDocument();

        $dom->preserveWhiteSpace = false;

        $dom->loadXML($xmlData);

        $xmlData = $dom->saveXML();

        $rawXml = $xmlData;

        $parser = xml_parser_create();

        xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 0);

//и т.д.



}

JakoDorgen PRO (продолжение-3) Зацените класс для работы Помогите дойти толку с

A

125

alarm

1 декабря 2010, 14:56

#8

Ёхан Палыч, cпасибо, учту на будущее.

Что делать, чтобы попасть в ответы Google Bard

Вышел новый Яндекс Браузер с YandexGPT и YandexART