Проблема с переносом старого phpbb, кодировками и т.п.

123
Mad_Man
На сайте с 10.11.2008
Offline
162
#11
sergey885:
проверил все из них - ни один не открыл файл без иероглифов

Я чую, что notepad++ преобразует их последовательно. Не нужно преобразовывать в кучу левых кодировок до нужной. Просто сразу откройте файл как 1252.

sergey885
На сайте с 19.08.2002
Offline
248
#12
Mad_Man:
Я чую, что notepad++ преобразует их последовательно. Не нужно преобразовывать в кучу левых кодировок до нужной. Просто сразу откройте файл как 1252.

разархивировал из архива дампа, открыл sql файл (ничего не меняя, просто через меню - открыть) - иероглифы.

перехожу в Character sets -> Western European -> Windows 1252

получаю:

ÀäìèÃ*èñòðÃ*öèÿ ÊëóáÃ* è ÔîðóìÃ*
интернет-маркетинг. стратегии развития веб-проектов.
Mad_Man
На сайте с 10.11.2008
Offline
162
#13

Пару строк файла к сообщению приложите для примера.

sergey885
На сайте с 19.08.2002
Offline
248
#14
Mad_Man:
Пару строк файла к сообщению приложите для примера.

сделал дамп в phpmyadmin одной из таблиц

zip categories.sql.zip
[umka]
На сайте с 25.05.2008
Offline
456
#15


INSERT INTO `phpbbru_categories` (`cat_id`, `cat_title`, `cat_order`) VALUES
(3, 'Дела', 30),
(4, 'Отдых', 40),
(5, 'Администрация Клуба и Форума', 10),
(6, 'Клуб', 20);

Данные в вашей таблице хранятся в latin1, записываются они в неё в кодировке cp1251, а дамп снят в кодировке utf-8.

В итоге получается кодировка древних кельтов. Сейчас ни где не используется, поэтому у вас не получается её прочитать.

Чтобы привести в человеческий вид, я рекомендую:

1. Скорвертировать дамп из utf-8 в cp1252 (windows latin1)

2. Интерпретировать его в cp1251

3. Далее сконвертировать опять в utf-8

4. Руками в дампе везде поменять latin1 на utf-8

Лог в помощь!
Mad_Man
На сайте с 10.11.2008
Offline
162
#16

Открываете в UTF8, потом сохраняете файл в 1252. После этого открываете как 1251. Вуаля.

UPD: пока писал, уже опередили (:

sergey885
На сайте с 19.08.2002
Offline
248
#17

спасибо, значит задача выполнима, а это уже хорошая новость.

Mad_Man, вроде делаю все как вы написали, но не получается..

что делаю (пишу подробно, т.к. кажется где-то в мелких деталях я что-то делаю не так):

1) notepad++ файл - открыть, указываю пусть к categories.sql

2) захожу в Encoding, там выставлено Encode in UTF without BOM

3) иду в Character sets, далее в Western Europen, кликаю на Windows-1252

получаю:

Aaieieno?aoey Eeoaa e Oi?oia

4) Иду в File -> Save as, сохраняю под другим именем. Закрываю все файлы.

5) File - Open, открываю второй файл

6) иду в Encoding -> Cyrillic -> Windows-1251, кликаю на нем, получаю:

Aaieieno?aoey Eeoaa e Oi?oia
Mad_Man
На сайте с 10.11.2008
Offline
162
#18
sergey885:
спасибо, значит задача выполнима, а это уже хорошая новость.

Mad_Man, вроде делаю все как вы написали, но не получается..
что делаю (пишу подробно, т.к. кажется где-то в мелких деталях я что-то делаю не так):
1) notepad++ файл - открыть, указываю пусть к categories.sql
2) захожу в Encoding, там выставлено Encode in UTF without BOM
3) иду в Character sets, далее в Western Europen, кликаю на Windows-1252
получаю:

4) Иду в File -> Save as, сохраняю под другим именем. Закрываю все файлы.
5) File - Open, открываю второй файл
6) иду в Encoding -> Cyrillic -> Windows-1251, кликаю на нем, получаю:

Найдите нормальное ПО для работы с данными.

Хелпзонович
На сайте с 15.06.2005
Offline
133
#19

Берете нормальный скрипт - снимаете дамп, восстанавливаете. Для редактирования базы используете adminer. Про phpMyAdmin забываете как страшный сон.

Вы там держитесь! Хорошего вам настроения. Здоровья.
[umka]
На сайте с 25.05.2008
Offline
456
#20
Хелпзонович:
Берете нормальный скрипт - снимаете дамп, восстанавливаете.

А "нормальный скрипт" сам допетрит, что в базу данных cp1252 заливают инфу в cp1251? :)

Или предполагается, что на новом месте будет такой же бардак с кодировками?

Хелпзонович:
Про phpMyAdmin забываете как страшный сон.

А он-то тут вообще причём? :)

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий