- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов
А 24,9% – на сегмент электронной коммерции
Оксана Мамчуева

Переиграть и победить: как анализировать конкурентов для продвижения сайта
С помощью Ahrefs
Александр Шестаков
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Чем можно в пакетном режиме конвертировать pdf файлы html с сохранением форматирования?
ФайнРидером можно. Причем даже те pdf, что собраны из графических файлов.
А как им пакетно конвертировать? Указать папку с тысячами файлов и что-бы он сам всё сделал.
Можно попробовать LibreOffice + unoconv, но у меня сейчас на небольшом наборе на зашло. Хотя вот делаю задание, и гоняю презентации в pdf без особых проблем.
Делал так:
Из того что смотрел более-менее подходит вот эта программа: http://www.freepdfsolutions.com/free-pdf-to-html.html но только вот в исходном коде html файла жесть творится. [ATTACH]175242[/ATTACH]
Да, оно всегда так делает. Я как-то doc в html конвертировал, там тоже мешанина. В итоге, пришлось парсить итоговый HTML и вырезать у тегов атрибуты, а также делать unwrap для тегов span. В итоге, оставались только одни теги p.
Ну а распарсить pdf в HTML с какой-либо вменяемой версткой вряд ли возможно. Где-то видел видео нейронной сети которая верстает с макетов.
Перепробовал кучу вариантов, везде какие-то косяки вылазят. Остановился на самом Акробате, там оказывается тоже можно пакетно экспортировать, правда форматирует тоже так себе но хоть слова не разрывает и кракозябры не выдаёт.
Вроде в .doc довольно многие раньше конвертировали, можно попробовать в него, и уже потом в html.
_SP_, я попробовал там проблема та-же, в коде куча мусора получается.
_SP_, я попробовал там проблема та-же, в коде куча мусора получается.
Так мусор удаляйте, в чём проблема ?
Зачастую можно просто реплейсом
Так если всё равно удалять зачем два раза конвертировать, Acrobat его меньше создаёт чем Word.