Valo

Рейтинг
131
Регистрация
21.04.2008

Ну 2 тогда. :)

Valo добавил 21.09.2008 в 13:57

А, стоп, не надо мне, снимаю ставку, извиняюсь.

Народ, домен-то хороший, не зеваем!!! ;)

Эротика как же? )

Заработок (не путать с зароботком :)), материальный достаток, инвестиции

Психология, личностный рост

У вас в подписи мягкий знак пропущен в слове "думаешь". )

Вот код-то как раз чистится специальным софтом.

Ну ладно, я смотрю, я вам надоел со своими рассуждениями, удачи в поиске.

если будем гонять из ПДФ в ВОРД и далее в ХТМЛ структуры вообще никакой не останется.

Кстати, из ворда-то как раз ХТМЛ элементарно делается, только код чистить надо.

Попробовал файнридером 7 в ХТМЛ напрямую. Страх господень.

Павел2007:
Вопрос стоит о специализированной программе, что бы перегнать все за 1 раз с сохранением структуры.

Павел, вы понимаете насколько это разные форматы? Спору нет, 10 000 файлов — это серьёзно, но времени на бесплодные поиски "лекарства" может уйти ещё больше, чем на обработку.

Понял, не только текст.

Способом, который предложил Str256, лично я не пользовался, пробовал ABBYYвским конвертером напрямую в ХТМЛ - лажа ваще.

Короче, мне, если честно, не попадался ни один хороший конвертер из PDF даже в doc или txt.

Единственное, что, на мой взгляд, можно попробовать сделать — это скормить PDF Файн Ридеру и попробовать там повозиться с ним, хотя бы текст распознать, который можно потом в HTML зафигачить.

Короче, похоже на то, что ручной обработки всё равно не избежать, просто надо понять, как это сделать малой кровью.

Если там только текст, то всё шикарно.

Leonid.Sh:
Хорошо цепануло) Это с пятницы эффект или чтото сегодня принимал?)

Тсссс! У меня просто проверенные источники непроверенной информации! ;)

Valo добавил 21.09.2008 в 01:13

ravadir:
Вирусный маркетинг или пальцем в небо попали?

Хаха, точняк, надо было там дор разместить, что ли? :)

А у вас ПДФ изначально из какой программы конвертировался?

Что там - текст, картинки? Текст не растрированный?

BrokenBrake:
По непроверенной информации налоговая полиция РФ заинтересовалась не на шутку WebMoney. В данный момент сливается вся инфа по транзакциям налоговикам :(

По непроверенной информации, воинственные гуманоиды с планеты Юпитер не на шутку заинтересовались темой зароботка в интернет, в обилии представленной на бесплатных хостингах. В данный момент сливается вся инфа по спонсорам, рефералам, стоимости кликов во bxod.com и аккаунтам, обнуленным за накрутку в Нитрокликс :(

И "молния"!

В настоящее время инопланетяне ведут активное скачивание бизнес-пакетов с сайта narubibabosy.fatal.ru! В случае внедрения описанных в них технологий, крах экономики планеты Юпитер неминуем! 😮

Всего: 2855