Перевод doc в html

123
E
На сайте с 05.01.2004
Offline
123
#11

Кстати, а средствами php нельзя попробовать сделать?

Сохраняем в ворде документ в виде html, после скриптом убираем все теги и двойные пробелы.

Только правда придется все-равно ручками потом проставлять переносы строк и.т.д.

Segey
На сайте с 23.08.2005
Offline
404
#12
evdy:
Только правда придется все-равно ручками потом проставлять переносы строк и.т.д.

Ну раз теги убираются, то и переносы строк подавно. Чем я и занимаюсь, вот только есть там конструкции вообще жуткого вида, я только половину вычистил а уже 20 выражений регулярных. Под некоторые незнаю как писать, вот и хотелось еще на стадии перевода что-то более менее толковое, чтобы потом проще обрабатывать было :)

Brexit - уже совсем рядом. (https://about-this-model.blogspot.com/2019/03/brexit.html)
Revan
На сайте с 09.09.2005
Offline
321
#13

WebMaster, делаю так же... так что какие траблы не понимаю :)

С уважением, Прокофьев Александр, founder KudaGo.com (http://kudago.com). Отдаем информацию обо всех мероприятиях в РФ + Киев по API (/ru/forum/912869) всем желающим.
E
На сайте с 05.01.2004
Offline
123
#14

Можно хотя, добавить в код, вставку переноса строк через скажем каждые 200 символов, у следующего пробела.

Хотя первоначального вида у текста все-равно не будет.

А вырезать регулярными то, что пихает Ворд в код - не утешительное занятие :)

Лучше в любом случае убирать все теги, а с простым текстом, куда проще работать.

Segey
На сайте с 23.08.2005
Offline
404
#15

Revan,

Много там мусора, хочется стерильно чтобы было :)

Блин, вот еще проблемка. Есть там такие пробелы для глаза, но никакими метода ми не удаляются т.е. их немогу найти ни как табуляцию, ни как пробел, ни как перенос строки... вообще непонятно что это за загадка :(

MadeInUSSR
На сайте с 14.11.2005
Offline
15
#16
Segey:
Посоветуйте програмку, которая может перевести doc в html и сохранить с более менее нормальным кодом? Или же почистить готовый html?
Пробовал дримвьювер - очень мало чистит, почти ничего.
Пробовал еще штук 5 программ, которые обещают чистку, однако они все специфичны и оставляют после себя почти полный объем мусора, который и был. Есть какой-то нормальный алгоритм чистки? 😕

В Dreamweaver есть такая функция ... перевод из дока в хтмл... а также чистка

пользуюсь только ею

Free proxy - Everyday (http://free-proxy.ucoz.ru/)
NetBot
На сайте с 26.10.2005
Offline
172
#17

В пхп есть такое средство.. strip_tags называется. :) Это как гелиотина помогает от перхоти.. результат 100% . гыыыыы..

Но вообще в визивиге SPAW есть чистилка вордовского мусора.

можно чистить в демке http://www.solmetra.com/spaw/demo/demo.php

(есть там кнопочка HTML cleanup) . Я как то давал знакомым эту демку. что бы они в ней расчистили грязный хтмл. Говорят помогло. Но всё это опять же постольку-поскольку.

~~

забыл упомянуть - иногда надо чистить 2 раза.

Russian
На сайте с 10.12.2005
Offline
69
#18

97 ворд нормально сохранял, без лишнего мусора. Специально ради этого не сносил 97 офис. Сейчас, правда, нет надобности, и снес. Попробуйте, реально :)

regta
На сайте с 15.04.2006
Offline
311
#19

FCKedit очень даже неплохо переводит doc в html

Часто интегрирована в CMS'ки

На поддерживаемом сайте есть такая штука - захожу в админку и гоняю ворд в хтмл. Процентов 95% решает все проблемы. В DW потом автоматом только пару тройку лишних атрибутов прихлопнуть остается.

Цитируйте, плиз, историю переписки в личке. Спасибо.
ID
На сайте с 02.09.2004
Offline
106
#20

Поддерживаю, FCKEditor - весьма полезная вещь для чистки кода. Один из его плюсов - никакой софт устанавливать не нужно. Вот здесь я поместил свои наблюдения по поводу эффективности его работы.

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий