как определить входящую кодировку

12
dkameleon
На сайте с 09.12.2005
Offline
386
#11
kav:
по сабжу : есть контент в неизвестной кодировке ... в рнр есть функция, перекодирующая из одной в другую, но если входящая кодировка не известна получается полная лажа...

требуется примерно следующее:


$INPUT_CHARSET = неизвестная_фукция_определения_кодировки($TEXT);

$TEXT = iconv("$INPUT_CHARSET//IGNORE", "WINDOWS-1251//IGNORE", "$TEXT");

И я добался до темы :)

Так пробовали?

$TEXT = mb_convert_encoding($TEXT, "windows-1251", "auto");
Дизайн интерьера (http://balabukha.com/)
kav
На сайте с 21.02.2006
Offline
159
kav
#12

спасибо всем!!!

буду пробовать все предложенные варианты, хотя пока, тк используются рсс ленты, остановился на варианте использования атрибута encoding="....." .

Но тк вебмастера часто не заморачиваются с написанием действительной кодировки канала, а ограничиваются копипастом из уже созданных каналов - все равно придется применять доп проверки...

Николай В., а если в тексте встретятся английские буковки - if (!$cp1251) не сработает, тк $cp1251 будет содержать некоторое количесво символов ..

еще раз ВСЕМ ТХАНКС

Я знаю только то, что ничего не знаю © Сократ а когда я забываю даже это, вспоминаю про..... Форум - это такое место, где 2-е людей могут убедить в своих заблуждениях тысячи
humbert
На сайте с 16.03.2006
Offline
540
#13

kav, решил проблему?

Тоже есть такое, не могу перекодировать автоматом

Парсинг прайс-листов, наполнение интернет-магазина товаром. (https://humbert.ru) Любая CMS (Битрикс, OpenCart, Prestashop и даже Woo Commerce )
Dreammaker
На сайте с 20.04.2006
Offline
569
#14

В обсуждениях на xpoint'e вспоминается вот эта библиотека, думаю, она может помочь.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий