Как перекодировать - win to utf массово?

S0
На сайте с 21.08.2012
Offline
51
364

Здравствуйте.

Скажите плиз, как перекодировать сотни html файлов из кодировки win в utf?

Пробовал на сервере через ssh таким макаром

find /папка/ -type f -name \*html -exec iconv -f cp1251 -t utf-8 '{}' -o '{}' \

плучилось

Скачать игры, играть бесплатно

тоесть, как я понял, документ остался win, а текст в нем перекодировался в utf

как правильно перекодировать файлы массово?

porh
На сайте с 14.06.2006
Offline
140
#1

UTFCast Express

S0
На сайте с 21.08.2012
Offline
51
#2
porh:
UTFCast Express

пробовал, тоже самое получилось, документ остался вин, внутри кракозябры

Ninoi
На сайте с 03.08.2017
Offline
182
#3
porh:
UTFCast Express
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

Не знаю как сейчас, но раньше бесплатная версия не конвертировала в UTF-8 без BOM. Перекодированные скрипты нормально не работали. Выручала програмка UTF-8 BOM Remover, или сразу поискать в сети UTFCast_no_BOM, это слегка модернизированная версия.

S0
На сайте с 21.08.2012
Offline
51
#4

может я не понимаю чего то

но после перекодирования этой прогой или моим первым вариантом, перекодируется только текст внутри

открываю в редакторе notepad++ вижу кракозябры, справа внизу показывает кодировку документа windows 1251

в других редакторах тоже самое вижу

в самом notepad++ можно перекодировать правильно документ, но там по одному, а у меня файлов штук 500

научите плиз чего я не понял или порекомендуйте еще способ

Оптимизайка
На сайте с 11.03.2012
Offline
396
#5

помимо перекодировки текста надо еще мета тег заменить в html


find /папка/ -type f -name \*html -exec sed -i -ure 's/windows-1251/utf-8/gI' '{}' ';'

и также убрать BOM если есть:


find /папка/ -type f -name \*html -exec sed -i '1s/^\xEF\xBB\xBF//' '{}' ';'
⭐ BotGuard (https://botguard.net) ⭐ — защита вашего сайта от вредоносных ботов, воровства контента, клонирования, спама и хакерских атак!
S0
На сайте с 21.08.2012
Offline
51
#6
Оптимизайка:
помимо перекодировки текста надо еще мета тег заменить в html

да, в файлах был метатег

<META content="text/html; charset=windows-1251" http-equiv=Content-Type>

похоже из за него редакторы открывали файлы в вин кодировке и меня это путало

спасибо, кажется разобрался

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий