Грязный html из Word. Что посоветуете?

D1
На сайте с 05.05.2004
Offline
280
1154

Часто приходиться файлы *.doc или *.xls автоматически конвертировать html ("Сохранить как Web-страницу с фильтром").

Для поисковиков был бы лучше чистый html. К тому может не все броузеры точно выведут на экран?

Отсюда вопрос: может есть какой-нибуль конвертор?

Помню недавнюю фразу, что Word 97 менее грязный код выдает.

Что еще посоветуете?

Всем заранее спасибо!

K
На сайте с 31.01.2001
Offline
737
#1

1) Все привести к одному шрифту и стилю в ворде. Жирность и др. - убрать. Сохранить в HTML.

2) В дримвейвере есть "Clean Up Word HTML".

Если что-то останется, можно убрать конкретные теги.

Код раза в 4 сократится.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
greenwood
На сайте с 08.09.2003
Offline
519
#2

всё равно получиться лажа ... пробовал разными прогами - результаты плачевные ...

лучше всего взять текст в буфер и скопировать в дремвер , как обычный текст

M
На сайте с 25.10.2003
Offline
100
#3
Как писал greenwood
всё равно получиться лажа ... пробовал разными прогами - результаты плачевные ...
лучше всего взять текст в буфер и скопировать в дремвер , как обычный текст

зачем плохому учишь...

я вон слабал себе скриптик который вырезает большинство отстоя

а вообще я люблю Ворд за то что он мусора вставляет не так уж мрного, по сравнению с другими прогами.

Хорошая штука Ворд... 97 :)

motopila.ru (http://motopila.ru/) - цепные пилы, все цепные пилы и ничего кроме цепные пилы. Аминь!
-=Илья=-
На сайте с 05.12.2003
Offline
222
#4
Для поисковиков был бы лучше чистый html

Скорее всего, поисковикам будет всё равно, грязный или чистый html.

S
На сайте с 25.12.2003
Offline
173
#5

Скорей всего поисковики понимают .doc файлы, и можно просто ссылку на этот файл дать и не париться.

Красивые сниппеты Google ( https://saney.com/tools/google-snippets-generator.html )
Back Door Man
На сайте с 20.08.2003
Offline
151
#6

Что-то в таком духе:

ereg_replace("<SPAN ([^>]+)>", "<span>", $my_text);

Дмитрий
А
На сайте с 29.07.2003
Offline
58
#7
D1
На сайте с 05.05.2004
Offline
280
#8

Уже ищу DreamViewer.

В моем случае руками тестк не поправишь, там иногда сложное переплетение с картинаками.

Пробовал убрать стили и все съехало

Альен, фильтр уже качаю.

Хотелось бы развить тему касаемо поисковиков:

Яндекс, например, если слова разделяются картинкой (она играет роль Tab) не подсвечивает их при найденных словах (запрос из двух слов). Может он и слова разделенные кучей тегов (face, class, span и т.д. тоже может посчитать далекостоящими?

K
На сайте с 22.10.2004
Offline
6
#9

лучшая чистилка хтмл - это руки. ИМХО. Может я и не прав.

p.s. нам любые дОроги дорОги!
greenwood
На сайте с 08.09.2003
Offline
519
#10
лучшая чистилка хтмл - это руки

конечно, если больше делать нечего .....

p.s

я гляжу, тут последнее время модным стало везде рисануться непоколебимым мнением преимущества ручных извращений :)

этакая вершина профессионализма :)

ссылки прописывать ручками, в тысячах каталогов региться-ручками ну и хет емеэли еще чистить руками.... вы чего ребята ? вчера с машинки печатной и калькулятора "Феликс" на компьютер пересели ? При громадном росте обьема обработки инфы Вас еще посещают мысли о ручной работе ?

нет программы-найди ее

не нашел - закажи

всячески избегайте отупелой работы - освобождайте мозги для творчества !

Это-ж страшно подумать даже .... потратить несколько часов а может и суток на чистку какого-то кода ... да за это время можно не одну девчонку выгулять .... в макдональс сходить али в библиотеку с ней .. :p

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий