- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Помогите пожалуйста найти программу для конвертации из формата PDF в формат HTML. Выкачал несколько программ в интернете (например Convert Doc) но проблема в том что они или русский язык не понимают и вместо кирилицы пишу ерунду, или зависают через 5 минут после начала работы.
Обрабатывать необходимо тысячи файлов и вручную тут не особо разбежишся.
Если кто то сталкивался киньте, только не подсовывайте пожалуйста то, чем сами не пользовались.
Заранее спасибо.
А у вас ПДФ изначально из какой программы конвертировался?
Что там - текст, картинки? Текст не растрированный?
А у вас ПДФ изначально из какой программы конвертировался?
Что там - текст, картинки? Текст не растрированный?
Да в том то и дело что все подряд - и текст и картинки. Но текст в принципе обычно от туда вручную вытаскивался, видимо не растрированный.
Можно в 2-а этапа:
1. PDF - Word = SolidConverterPDF (пробовал)
2. Word - HTML = WordCleaner (есть, но не пробовал)
Всё конечно зависит, как правильно заметил Valo, что у вас там растр или текст. Если растр, то надо распознавать.
Короче, мне, если честно, не попадался ни один хороший конвертер из PDF даже в doc или txt.
Единственное, что, на мой взгляд, можно попробовать сделать — это скормить PDF Файн Ридеру и попробовать там повозиться с ним, хотя бы текст распознать, который можно потом в HTML зафигачить.
Короче, похоже на то, что ручной обработки всё равно не избежать, просто надо понять, как это сделать малой кровью.
Если там только текст, то всё шикарно.
fine reader 9 есть такая функция
Понял, не только текст.
Способом, который предложил Str256, лично я не пользовался, пробовал ABBYYвским конвертером напрямую в ХТМЛ - лажа ваще.
Valo, прежде чем писать попробуй
Понял, не только текст.
Способом, который предложил Str256, лично я не пользовался, пробовал ABBYYвским конвертером напрямую в ХТМЛ - лажа ваще.
верно подметили, лажа полная. но согласитесь, если будем гонять из ПДФ в ВОРД и далее в ХТМЛ структуры вообще никакой не останется.
Павел2007 добавил 21.09.2008 в 01:42
fine reader 9 есть такая функция
скажите Вы это пробовали и у Вас хорошо вышло?
Павел2007,да пробовал вышло но есть. валидности никакой
Павел2007,да пробовал вышло но есть. валидности никакой
простите, а по русски? хрень полная вышла?