- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы
Для интернет-магазина инженерных систем
Мария Лосева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Приветствую.
Возникла задача создать программное решение для оптимизации процесса публикации на сайт структурированных документов.
Пример:
Есть большой документ, который содержит двух- трехуровневую структуру.
Раздел 1. Название раздела
Раздел 2. Название раздела
И т.д. Примером подобного документа может служить любой Кодекс, который состоит из Разделов, разделы из Глав, главы из Статей.
Стоит задача, публиковать такие документы на сайте вот в таком виде (пример): http://www.consultant.ru/popular/ukrf/
Причем хотелось бы процесс публикации максимально автоматизировать и упростить.
Возникает вопрос,
1. Существуют ли уже готовые решения для таких задач?
2. Если нет, и надо писать собственный скрипт, то какую бы (примерно) логику вы предложили? Мы попытались реализовать это через парсинг документов WORD, в которых заранее указываем уровень заголовков, но наступили на грабли: PHP плохо обрабатывает регулярными выражениями длинные строки.
PHP вообще документы Office плохо воспринимает, насколько я знаю.
В теории можно вообще сохранять в текстовые файлы, так как например если после и перед новой главой (условно), есть например по 2 перевода строки - то можно парсить такими методами.
Ну кстати, да, как вариант, Спасибо.
Но с txt сразу как-то не захотели связываться, так как исходные документы могут содержать картинки.
Интересно, есть ли готовые решения для таких задач. Не верю, что у нас первых возникла такая задачка.
как вариант можно найти конвертер из word в txt, на php сам видел такой, А вообще на великом и могучем есть http://ru2.php.net/com вот что. работать правда будет только под виндой.
Не, к сожалению решение только под винду нам не подходит. Надо чтоб все было под веб-сервер на linux.
Профи, помогите советом
я не профи, но вот совет: док офиса сохранять можно как веб страницу с фильтром, приэтом выделяя разделы "кодекса" заголовками(1,2,3 и т.д). картинки насколько знаю сохранятся в определенной директории. птом дело скрипта присвоить заголовкам и картинкам - ссылки...
а так, видел многих на форуме кто скриптами занимался.. поиск в зубки.
удачи книжник!)
А Open Document Format не подходит? Вроде как новые версии MSOffice могут в нем сохранять, не считая нативной поддержки в Open/LibreOffice.
На выходе - xml-документ в открытом стандартизированном формате, где главы будут иметь иерархическую структуру.