doc и xml

MiladyX
На сайте с 23.09.2008
Offline
65
1016

Скажите плиз можно ли как то с ворда перегнать в хмл файл, чтобы импортировать в Ворд Пресс?

Подскажите софт если имеется, по возможности бесплатный :)

P
На сайте с 26.02.2009
Offline
3
#1

Нет ничего проще...

Сохраняешь ворд файл как txt и оттуда парсишь.

А вот как именно парсишь, зависит от задач

[Удален]
#2

prformail, пукнул в лужу, молодец.

MiladyX, я не знаю какой формат xml понимает WP, но в ворде вообще то есть "сохранить как"->"XML" =)

а у 2007 ворда формат .docx ни что иное как зипованный xml

arkadiy_a
На сайте с 11.06.2008
Offline
82
#3

WP не использую но у меня с Джумлой такая практика.

Ворд при экспорте в веб вставляет кучу ненужных тагов, раздувая текст иногда в 4 раза и вставляя атрибуты видимые потом только в IE.

Сам пользуюсь в таких случаях OpenOffice -импортирую туда .doc документ (или делаю копи/паст) и сохраняю как веб-страницу. Потом этот HTML вставляю в редактор в своей CMS. В особо запущеных случаях (например надо из ворда вставить хитро отформатированную таблицу) только OpenOffice и выручает.

[Удален]
#4

Не путайте теплое с мягким. XML это не HTML

Вордовский XML четко структурирован и на него есть спецуха на msdnе

FladeX
На сайте с 07.11.2008
Offline
163
#5

Сохраните doc как odt (OpenOffice). Переименуйте получившийся файл в .zip и откройте как обычный архив - внутри увидите xml.

Услуги посредника на бирже контента: информационные статьи 40₽/1000, «продающие» тексты 50₽/1000. Пишите в личку. Помогаю правильно переехать на https (/ru/forum/973447). Подписывайтесь на мой канал в телеграм: https://t.me/fladex (https://t.me/fladex).
[Удален]
#6
FladeX:
Сохраните doc как odt (OpenOffice). Переименуйте получившийся файл в .zip и откройте как обычный архив - внутри увидите xml.

потрясающе, а почему бы не сохранить его как docx, переименовать в зип и увидеть внутри xml?

FladeX
На сайте с 07.11.2008
Offline
163
#7

Я возможно ошибаюсь, но вроде docx это какой-то закрытый (или что-то типа того) формат от нашей любимой Microsoft. Поэтому лучше с odt работать :)

invoice
На сайте с 06.07.2006
Offline
49
#8
FladeX:
Я возможно ошибаюсь, но вроде docx это какой-то закрытый (или что-то типа того) формат от нашей любимой Microsoft. Поэтому лучше с odt работать :)

Ничего он не закрытый :) Все давно "открыли".

[Удален]
#9

Не увернен,что выдраный из .docx ХМЛ поймёт ВП.

К тому же ВП есть свой расширенный ХМЛ - XML-RPC.

Если я не ошибаюсь - Ворд2007 сам умеет экспортировать контент для ВП (сейчас нет возможности посмотреть).

ТС, возможно, не совсем, то, что нужно, но вот посмотри сторонние приложения:

1. ВордпрессТранслятор. Тут где-то на форуме разработчики. Стоит очень дорого.

2. Есть бесплатный WordBot. Тоже здешнего обитателя. Но по-моему он только из текстовыми файлами работает.

3. Цербер - тоже платный. Функционал не помню (помню-постер в ВП)

4. post2blog - бесплатная вроде. Через СТР+С СТР+V работает форматирование. Картинки отдельно нужно указывать.

Как вариант - сохранять из Ворда в хтмл, потом почистить его (есть десктоп тулзы. Онлайн по-моему у Ласто видел), а уж результат скармливать десктопным постилкам. Только тут уже не ХМЛ.

А вообще тема уже неоднократно понималась. Поищи по форуму. (в тч и по вордпресовскому ;) )

Yamramil
На сайте с 21.01.2009
Offline
127
#10

Вот то что ты искал econv.ru :)

Дешевые VDS + лучшая тех. поддержка - тыксь (https://friendhosting.net/pl.php?7150)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий