- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
VK приобрела 70% в структуре компании-разработчика red_mad_robot
Которая участвовала в создании RuStore
Оксана Мамчуева
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Требуется считывать html, убирать из него все форматирование, оставляя только простые теги. Т.е. если было <font size="5" face="..."> то надо оставить только <font size="5">. Если было <h1><...>heading</...></h1>, то оставить надо только <h1>heading</h1>. Т.е. некоторый упроститель html.
Существует ли готовое решение?
В Perl CookBook есть подобный пример - там тэги меняют на что-то ещё. Думаю это "что-то ещё" заменить труда не составит.
И ещё, есть прога, которая выдирает "лишние" тэги (например, которые Word городит). Но это за денежку.
В Perl CookBook есть подобный пример - там тэги меняют на что-то ещё. Думаю это "что-то ещё" заменить труда не составит.
Ага, оно-то не составит:
$html=~s/<(\S+(\s+\S+)?).*?(>.+< )?(\/$1)/<$1$3$4/g;
$html=~s/<(h\d+)>(.*?)>(.+)?<(.*)?>(<\/$1)/<$1>$3$5/g;
Только будет ли работать во всех случаях?
2DM: а зачем, если не секрет, это нужно?
Наверное не совсем четко выразился :-).
Ситуация такая - есть один статический сайт (в нем много страниц
), из него надо сделать другой статический сайт с такой же структурой (по файлам и директориям), но изменить его внешний вид (ну типа навигация сверху была, а стала сбоку) + замену слов (чтобы в таблице задавалось). Естественно надо сделать, чтобы потом руками не надо было подправлять. Вот что нужно в идеале
. Вот меня интересует, есть что-нибудь готовое для этого или придется все-таки самому "программировать" ?
В части редизайна тебе вряд ли что поможет. А для замены - есть такая программа, называется Advanced Search and Replace, она может производить массовую замену с использованием регулярных выражений. Я видел ее как-то в сломанном виде, поищи, может, найдешь.
Расширенный поиск/замена есть в HomeSite
Требуется считывать html, убирать из него все форматирование, оставляя только простые теги. Т.е. если было <font size="5" face="..."> то надо оставить только <font size="5">. Если было <h1><...>heading</...></h1>, то оставить надо только <h1>heading</h1>. Т.е. некоторый упроститель html.
Существует ли готовое решение?
Копируешь содержимое в Notepad и все тэги пропадают. Потом Copy из Notepada - Paste в HTML редактор и получаешь страницу с минимальным количеством тэгов.