- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Приветствую.
Возникла задача создать программное решение для оптимизации процесса публикации на сайт структурированных документов.
Пример:
Есть большой документ, который содержит двух- трехуровневую структуру.
Раздел 1. Название раздела
Раздел 2. Название раздела
И т.д. Примером подобного документа может служить любой Кодекс, который состоит из Разделов, разделы из Глав, главы из Статей.
Стоит задача, публиковать такие документы на сайте вот в таком виде (пример): http://www.consultant.ru/popular/ukrf/
Причем хотелось бы процесс публикации максимально автоматизировать и упростить.
Возникает вопрос,
1. Существуют ли уже готовые решения для таких задач?
2. Если нет, и надо писать собственный скрипт, то какую бы (примерно) логику вы предложили? Мы попытались реализовать это через парсинг документов WORD, в которых заранее указываем уровень заголовков, но наступили на грабли: PHP плохо обрабатывает регулярными выражениями длинные строки.
PHP вообще документы Office плохо воспринимает, насколько я знаю.
В теории можно вообще сохранять в текстовые файлы, так как например если после и перед новой главой (условно), есть например по 2 перевода строки - то можно парсить такими методами.
Ну кстати, да, как вариант, Спасибо.
Но с txt сразу как-то не захотели связываться, так как исходные документы могут содержать картинки.
Интересно, есть ли готовые решения для таких задач. Не верю, что у нас первых возникла такая задачка.
как вариант можно найти конвертер из word в txt, на php сам видел такой, А вообще на великом и могучем есть http://ru2.php.net/com вот что. работать правда будет только под виндой.
Не, к сожалению решение только под винду нам не подходит. Надо чтоб все было под веб-сервер на linux.
Профи, помогите советом
я не профи, но вот совет: док офиса сохранять можно как веб страницу с фильтром, приэтом выделяя разделы "кодекса" заголовками(1,2,3 и т.д). картинки насколько знаю сохранятся в определенной директории. птом дело скрипта присвоить заголовкам и картинкам - ссылки...
а так, видел многих на форуме кто скриптами занимался.. поиск в зубки.
удачи книжник!)
А Open Document Format не подходит? Вроде как новые версии MSOffice могут в нем сохранять, не считая нативной поддержки в Open/LibreOffice.
На выходе - xml-документ в открытом стандартизированном формате, где главы будут иметь иерархическую структуру.