- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Все что нужно знать о DDоS-атаках грамотному менеджеру
И как реагировать на "пожар", когда неизвестно, где хранятся "огнетушители
Антон Никонов
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Требуется считывать html, убирать из него все форматирование, оставляя только простые теги. Т.е. если было <font size="5" face="..."> то надо оставить только <font size="5">. Если было <h1><...>heading</...></h1>, то оставить надо только <h1>heading</h1>. Т.е. некоторый упроститель html.
Существует ли готовое решение?
В Perl CookBook есть подобный пример - там тэги меняют на что-то ещё. Думаю это "что-то ещё" заменить труда не составит.
И ещё, есть прога, которая выдирает "лишние" тэги (например, которые Word городит). Но это за денежку.
В Perl CookBook есть подобный пример - там тэги меняют на что-то ещё. Думаю это "что-то ещё" заменить труда не составит.
Ага, оно-то не составит:
$html=~s/<(\S+(\s+\S+)?).*?(>.+< )?(\/$1)/<$1$3$4/g;
$html=~s/<(h\d+)>(.*?)>(.+)?<(.*)?>(<\/$1)/<$1>$3$5/g;
Только будет ли работать во всех случаях?
2DM: а зачем, если не секрет, это нужно?
Наверное не совсем четко выразился :-).
Ситуация такая - есть один статический сайт (в нем много страниц
), из него надо сделать другой статический сайт с такой же структурой (по файлам и директориям), но изменить его внешний вид (ну типа навигация сверху была, а стала сбоку) + замену слов (чтобы в таблице задавалось). Естественно надо сделать, чтобы потом руками не надо было подправлять. Вот что нужно в идеале
. Вот меня интересует, есть что-нибудь готовое для этого или придется все-таки самому "программировать" ?
В части редизайна тебе вряд ли что поможет. А для замены - есть такая программа, называется Advanced Search and Replace, она может производить массовую замену с использованием регулярных выражений. Я видел ее как-то в сломанном виде, поищи, может, найдешь.
Расширенный поиск/замена есть в HomeSite
Требуется считывать html, убирать из него все форматирование, оставляя только простые теги. Т.е. если было <font size="5" face="..."> то надо оставить только <font size="5">. Если было <h1><...>heading</...></h1>, то оставить надо только <h1>heading</h1>. Т.е. некоторый упроститель html.
Существует ли готовое решение?
Копируешь содержимое в Notepad и все тэги пропадают. Потом Copy из Notepada - Paste в HTML редактор и получаешь страницу с минимальным количеством тэгов.