ps/pdf/word 2text парсеры

I
На сайте с 26.05.2001
Offline
64
785

Господа, а никто не пытался апгрейдить стандартные утилиты word2x, pdf2text, ps2text до состояния, когда они русские буквы выдают в каком-то приемлемо виде? Насколько я понял, по-крайней мере, для pdf и ps основная проблема у этих утилит заключается в том, что они просто не знают в какой кодировке выдывать не аскии символы. Или все писали "с нуля"? Может есть-что готовое, но недорогое? Только надо, чтобы это работало, как под линуксом, так и под фрибсди.

Приходите завтра, завтра будет! (http://itman666.livejournal.com)
D
На сайте с 16.03.2006
Offline
3
Dip
#1
itman:
Господа, а никто не пытался апгрейдить стандартные утилиты word2x, pdf2text, ps2text до состояния, когда они русские буквы выдают в каком-то приемлемо виде? Насколько я понял, по-крайней мере, для pdf и ps основная проблема у этих утилит заключается в том, что они просто не знают в какой кодировке выдывать не аскии символы. Или все писали "с нуля"? Может есть-что готовое, но недорогое? Только надо, чтобы это работало, как под линуксом, так и под фрибсди.

А чего там пытаться ?

Задача не сложная.

Пара-тройка дней программерского труда.

Можете урл на word2text кинуть ?

I
На сайте с 26.05.2001
Offline
64
#2
Dip:
А чего там пытаться ?
Задача не сложная.
Пара-тройка дней программерского труда.
Можете урл на word2text кинуть ?

Ну я не знаю объемов труда, поэтому спрашиваю. Word2Text, вроде бы, вот это. Но, кстати, говоря вордовый парсер это дело двадцатое. Главное pdf и ps.

Ank
На сайте с 26.04.2004
Offline
108
Ank
#3

с никсах из дока (ворд) работает стандартный catdoc.

все себе по русски, минус форматирование есс-но.

Ссылка за контент ( http://www.acma.ru ) прямая и безответная. ► [url=https://saas24.ru/saas_category/dedicated/?utm_source=forums&utm_medium=signatures&utm_campaign=dedicated_s24]Рейтинг серверов[/url] — ТОП10 ◄
I
На сайте с 26.05.2001
Offline
64
#4
Ank:
с никсах из дока (ворд) работает стандартный catdoc.
все себе по русски, минус форматирование есс-но.

Вот спасибо!!! попробую, одним, значит геморроем меньше. Как грится, зачем что-то делать, когда есть готовое ;)

I
На сайте с 26.05.2001
Offline
64
#5

Ага, catdoc понимает charset огромное спасибо. На тему pdfа, это извините было из серии "я не тормоз" стандартная утилита умеет делать вывод в UTF!

Всем спасибо за внимание

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий