Ищу программиста для написания программы конвертации doc->html

12
L
На сайте с 26.04.2006
Offline
218
Lev
1655

См. подробности тут: /ru/forum/644457

Естественно, программа не должна использовать вордовский модуль "Сохранить как", поскольку при конвертировании в html таким путем в результате html получается раздутым и неоптимизированным.

Сколько такое может стоить?

Рекомендую бюро переводов в Москве (http://www.norma-tm.ru) - опыт с 1999 года. Списать долги? Для этого надо пройти банкротство физлиц (https://totbankrot.ru/)
SM
На сайте с 17.08.2009
Offline
142
#1

Причем здесь дизайн? В свое время, действовал так. Открывал doc файл, проставлял H1 и H2, сохранял в html. Далее использовал программу TextKit Free версию. Меню Импорт - подготовленный Word/Html. Раскидывал на разные даты и экспортировал всё в файл для дальнейшего импорта в WP. Посмотрите в этом направлении, может пригодится.

ТВЭЛ
На сайте с 29.09.2006
Offline
111
#2

Могу написать на PHP в виде web-сервиса, которому вы бы скармливали уже результат своего "сохранить как". В среднем сколько страниц у вас там планируется на один документ? Долларов $150-200, в зависимости от наличия или отсутствия подводных камней.

P.S. Полный адрес вводить не надо, лучше относительные ссылки в меню делать.

ТВЭЛ добавил 26.07.2011 в 09:30

s-maximoff, ошибся человек, наверно, вряд ли специально.

ТВЭЛ добавил 26.07.2011 в 09:31

А вообще, предварительно прошерстите выдачу, может вам и не надо тратиться.

http://www.google.ru/search?q=doc2html

Время не ждёт.
L
На сайте с 26.04.2006
Offline
218
Lev
#3

Спасибо за ссылку, почитал документацию к программе DOC2HTML - это половина того, что нужно, но она не создает навигационное меню (кстати, пожалуй, действительно лучше короткие ссылки использовать, без полного маршрута). Насчет PHP одно не понимаю: если ему скармливать результат сохранения из ВОРДа, как она будет на страницы делить, ведь весь файл будет сохранен в 1 странице? Документы - от неск.десятков до неск.сотен страниц, есть и по 600-800, но единичные

ТВЭЛ
На сайте с 29.09.2006
Offline
111
#4

Вот 600-800 страниц немножко пугают, при ограничении времени исполнения скрипта в 30 сек. на хостинге может и не хватить. Но скорей всего быстро будет работать даже в этом случае.

Другой вопрос - насколько это нужно вам. Если нужно обработать всего лишь 10-20 документов, например, может проще и быстрее ручками с помощью этой doc2html + какой-нибудь скриптик для программерского текстового редактора, режущий файл и вставляющий меню.

Если же регулярно вам это надо делать, то моё предложение в силе.

Могу сваять такую хреновину.

L
На сайте с 26.04.2006
Offline
218
Lev
#6

Спасибо за ссылки, но эти утилиты не рубят на отдельные файлы страницы и не вставляют в них меню, а речь идет о тысячах документов и десятках тысяч страниц, так что автоматизация нужна

Lev добавил 27.07.2011 в 13:08

ТВЭЛ:
Вот 600-800 страниц немножко пугают, при ограничении времени исполнения скрипта в 30 сек. на хостинге может и не хватить. Но скорей всего быстро будет работать даже в этом случае.

Другой вопрос - насколько это нужно вам. Если нужно обработать всего лишь 10-20 документов, например, может проще и быстрее ручками с помощью этой doc2html + какой-нибудь скриптик для программерского текстового редактора, режущий файл и вставляющий меню.

Если же регулярно вам это надо делать, то моё предложение в силе.
Могу сваять такую хреновину.

Основная масса документов - от 30-50 до 100-150 страниц. По-прежнему не понимаю, как будет рубить на страницы, если скармливать сервису единый html (по какому принципу определять начало следующей страницы), хотя это не особо важно. И куда будет сохранять результат (включая картинки). Да, и хотелось бы уложиться в 3000 р. - это никак невозможно?

Напишите мне в личку, пожалуйста

galion
На сайте с 13.05.2009
Offline
167
#7
Lev:
(по какому принципу определять начало следующей страницы)

Обычно знаком-разделителем, иначе не как, вручную проставить такие разделители достаточно быстро.

Lev:
Да, и хотелось бы уложиться в 3000 р. - это никак невозможно?

Нереально, где-то с год назад заказывал подобную софтину, из doc файлов делает полностью готовые хтмл сайты одним кликом, стоила около 300$.

ТВЭЛ
На сайте с 29.09.2006
Offline
111
#8
Lev:
По-прежнему не понимаю, как будет рубить на страницы, если скармливать сервису единый html (по какому принципу определять начало следующей страницы), хотя это не особо важно.

Вы что-то говорили о подзаголовках. Можно их использовать для разбиения.

Впрочем, пока в любом случае не вполне ясна ваша задача.

Как делать меню, если у вас 600 страниц, например?

Lev:
И куда будет сохранять результат (включая картинки).

А куда сохраняет Word? Просто у меня его вообще нет, я в Линуксе работаю, не могу проверить.

Lev:
Да, и хотелось бы уложиться в 3000 р. - это никак невозможно?

Точно нет, я и так уже думаю, что слишком мало запросил - потенциально тут много всего всплыть может.

ТВЭЛ добавил 27.07.2011 в 16:13

galion:
Обычно знаком-разделителем, иначе не как, вручную проставить такие разделители достаточно быстро.

Да ну, это несерьёзно. Думаю, надо определить средний размер страниц и на этой основе разбивать либо с подзаголовками, либо, если раздел большой - по абзацам.

galion
На сайте с 13.05.2009
Offline
167
#9
ТВЭЛ:
Да ну, это несерьёзно. Думаю, надо определить средний размер страниц и на этой основе разбивать либо с подзаголовками, либо, если раздел большой - по абзацам.

а что хорошего по размеру или по абзацам? Разделителями хотя бы точно то что нужно, и проставить их быстро, а как вы предлагаете, неизвестно что на выходе получится, тексты то не штампованные одинакового размера...

ТВЭЛ
На сайте с 29.09.2006
Offline
111
#10

Так они и не должны быть одинакового размера. Я ж говорю, по абзацам, сделать настройку примерного расхождения размера страницы, и всё. Допустим, 3000-4000 символов, но если между подзаголовками 5000 - сделать из этого куска одну страницу. Автоматически.

Как вы быстро вручную проставите разделители для сотен страниц - я не представляю.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий