Перевод в утф чего угодно

CR
На сайте с 21.11.2008
Offline
146
957

Нужна функция, переводящая что угодно (кои8, сп1251 или исо) в утф8.

Просто мой скрипт по сути ищет кой че в гугле, а тот подсовывает все разное, поэтому на сайте кракозябры.

Кто знает где капать? Писать не заставляю, но если сможете - супер.

J
На сайте с 02.02.2009
Offline
53
#1

эм, iconv :D

S
На сайте с 20.04.2004
Offline
145
sss
#2

в перле копать в сторону Encode:

use Encode;

print "Content-type: text/html; charset=UTF-8\n\n";

my $text="Текст в вин 1251";

Encode::from_to($text, 'windows-1251', 'utf-8');

print $text;

J
На сайте с 02.02.2009
Offline
53
#3

В перле кстати тоже есть iconv :D

FeoOne
На сайте с 27.12.2008
Offline
32
#4
jumash:
эм, iconv :D

+ mb-convert-encoding

CR
На сайте с 21.11.2008
Offline
146
#5

jumash, иконв не установлен

J
На сайте с 02.02.2009
Offline
53
#6
Chikey.ru:
jumash, иконв не установлен

convert_cyr_string

Linkpusher
На сайте с 28.12.2007
Offline
176
#7

польский тяжеловес :) ConvertCharset class

  • Conversion between 1 byte character sets
  • Conversion from 1 byte to multi byte character set (utf-8)
  • Conversion from multibyte character set (utf-8) to 1 byte character set
  • Every conversion output can be save with numeric entities (browser character set independent)
  • This is a list of character sets you can operate with. The main requirement is that a character has to be in both character sets, otherwise it will return an error.

WINDOWS
  • windows-1250 - Central Europe
  • windows-1251 - Cyrillic
  • windows-1252 - Latin I
  • windows-1253 - Greek
  • windows-1254 - Turkish
  • windows-1255 - Hebrew
  • windows-1256 - Arabic
  • windows-1257 - Baltic
  • windows-1258 - Viet Nam
  • cp874 - Thai - this file is also for DOS

DOS
  • cp437 - Latin US
  • cp737 - Greek
  • cp775 - BaltRim
  • cp850 - Latin1
  • cp852 - Latin2
  • cp855 - Cyrylic
  • cp857 - Turkish
  • cp860 - Portuguese
  • cp861 - Iceland
  • cp862 - Hebrew
  • cp863 - Canada
  • cp864 - Arabic
  • cp865 - Nordic
  • cp866 - Cyrylic Russian (this is the one, used in IE "Cyrillic (DOS)" )
  • cp869 - Greek2

MAC (Apple)
  • x-mac-cyrillic
  • x-mac-greek
  • x-mac-icelandic
  • x-mac-ce
  • x-mac-roman

ISO (Unix/Linux)
  • iso-8859-1
  • iso-8859-2
  • iso-8859-3
  • iso-8859-4
  • iso-8859-5
  • iso-8859-6
  • iso-8859-7
  • iso-8859-8
  • iso-8859-9
  • iso-8859-10
  • iso-8859-11
  • iso-8859-12
  • iso-8859-13
  • iso-8859-14
  • iso-8859-15
  • iso-8859-16

MISCELLANEOUS
  • gsm0338 (ETSI GSM 03.38)
  • cp037
  • cp424
  • cp500
  • cp856
  • cp875
  • cp1006
  • cp1026
  • koi8-r (Cyrillic)
  • koi8-u (Cyrillic Ukrainian)
  • nextstep
  • us-ascii
  • us-ascii-quotes
Точу ножи. Буквально. Есть отзывы. Заказать заточку в МСК и Подольске можно через Телеграмм.
S
На сайте с 28.10.2005
Offline
319
#8

Садись, двойка :D

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий