Конвертация из PDF в HTM

1 2345 6
V
На сайте с 21.04.2008
Offline
131
#31

Вот код-то как раз чистится специальным софтом.

Ну ладно, я смотрю, я вам надоел со своими рассуждениями, удачи в поиске.

[Удален]
#32
Valo:
Ну ладно, я смотрю, я вам надоел со своими рассуждениями, удачи в поиске.

Дык все ему надоели, я смотрю. Сорри, ТС, что опять встреваю. ;)

S2
На сайте с 07.01.2008
Offline
611
#33
Павел2007:
готовы вычистить 10 тысяч страниц?

Почитайте это: http://wordexpert.ru/2006/10/12/kak-preobrazovat-dokument-word-doc-v-format-html

А для обработки pdf - думаю можно написать bat-файл для соответствующей программы. Будет автоматом запускать следующую копию, после окончания работы с предыдущей.

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
П2
На сайте с 14.10.2007
Offline
122
#34
Str256:
Почитайте это: http://wordexpert.ru/2006/10/12/kak-preobrazovat-dokument-word-doc-v-format-html
А для обработки pdf - думаю можно написать bat-файл для соответствующей программы. Будет автоматом запускать следующую копию, после окончания работы с предыдущей.

то есть что то уже готового Вы думаете нет?

sabotage
На сайте с 14.02.2007
Offline
192
#35

Как раз сейчас занимаюсь тем, что разбираю всевозможный софт на тему PDF, более 50 наименований. Нормального конвертора в html даже для простого (очень простого) документа быть не может. Суть заключается в максимальном приближении результата к оригиналу, поэтому кода будет много и грязного.

Единственно верный вариант для чистого кода - конвертация в txt. Я поступил бы именно так - выгрузил текст и распарсил бы в БД.

Str256:
А для обработки pdf - думаю можно написать bat-файл для соответствующей программы. Будет автоматом запускать следующую копию, после окончания работы с предыдущей.

Практически все конверторы поддерживают пакетную обработку.

П2
На сайте с 14.10.2007
Offline
122
#36
sabotage:
Единственно верный вариант для чистого кода - конвертация в txt.

я с Вами согласен - перегнать в ТХТ просто, но как быть с картинками?

X-whisper
На сайте с 01.05.2006
Offline
155
#37

Я пользуюсь pdf_to_html, все прекрасно перегоняет, правда без лицензии ограничения на количество страниц.

Мне не хватает внимания со стороны поисковиков, обнимите меня кто-нибудь. Аватары (http://avatarko.ru/)
П2
На сайте с 14.10.2007
Offline
122
#38
X-whisper:
Я пользуюсь pdf_to_html, все прекрасно перегоняет, правда без лицензии ограничения на количество страниц.

линк можете дать?

sabotage
На сайте с 14.02.2007
Offline
192
#39
X-whisper:
Я пользуюсь pdf_to_html, все прекрасно перегоняет, правда без лицензии ограничения на количество страниц.

X-whisper, а кто говорит, что плохо перегоняет? Конечно хорошо. Только код там ппц.

Вот этим может?

http://www.quick-pdf.com/

http://www.quick-pdf.com/PDF2HtmlSetup.exe

Так там столько div'ов на один кран, что диву даешься. 😂

S2
На сайте с 07.01.2008
Offline
611
#40
X-whisper:
Я пользуюсь pdf_to_html, все прекрасно перегоняет, правда без лицензии ограничения на количество страниц.

Есть такая прога, но ни разу не пользовался. Или вот на форуме чел предлагал услуги, может и за вашу проблему возьмётся: /ru/forum/215306

bat-файлы - пишутся под конкретную операцию. http://old.yandex.ru/yandsearch?text=bat+%D1%84%D0%B0%D0%B9%D0%BB

1 2345 6

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий