UTF8 to CP1251 знаки вопроса

I
На сайте с 04.08.2006
Offline
112
1572

Здравствуйте.

Написал парсер для одного польского сайта.

Он в УТФ8, мой сайт в ср1251

После получение страницы в УТФ8, мне нужно сделать матчинг по словам.

Но в польском языке есть некоторые буквы с "черточками" сверху.

В утф8 текст отображается нормально, но после iconv("UTF-8", "cp1251//TRANSLIT", page)

У меня вместо этих букв отображаются знаки вопроса, остальной текст конвертируется нормально.

параметр TRANSLIT, как я понимаю должен был заменить эти спец символы для польского языка, нашими символами.

Тоесть о (с черточкой) заменить на простую о и т.д.

Мне нужно текст сохранить читабельным но без этих символов, тоесть заменить их на наши.

Как быть?

Спасибо.

Инновационный автомобильный проект. Экономия от 500 - 3000$ при покупке автомобиля (http://autoline24.com.ua) Магазин-блог уникальных полезных скриптов (http://ivashka.org.ua)
A
На сайте с 06.05.2009
Offline
28
#1

setlocale(LC_CTYPE, 'pl_PL');

echo iconv('UTF-8', 'cp1251//TRANSLIT', "język polski\n"); ?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий