Чистка HTML кода для ленивых и очень ленивых

NA
На сайте с 24.01.2009
Offline
57
7002

При создании СДЛ сайтов было необходимо собирать информацию о фирмах и продуктах фирм.

У каждой фирмы интернет страницы отличаются и наполнения своего сайта уже готовыми страницами скопированных у фирм усложняется наличием в них ненужных стилей ссылок и тд. Что решается чисткой скопированного фрагмента HTML кода.

К сожалению нужной программы для автоматической чистки кода я не нашел, а для того что бы чистить в ручную я слишком ленив. Для замены ручного труда на автоматический была написана программа которую выкладываю для бесплатного стачивания.

О возможностях программы.

Основная задача очистка: текста, HTML текста от ненужных слов, стилей, классов и тд.

Копирование страницы в зону обработки вместе со стилями как в ворде.

Привычный HTML редактор TinyMce для визуального редактирования.

Подсветка HTML синтаксиса для редактирования в коде.

Автоматическая сборка ненужных атрибутов со скопированной страницы - фрагмента HTML кода.

Предоставление на редактирование найденных лишних атрибутов.

Использование регулярных выражений во время поиска, замены для ленивых.

Сохранение шаблона поиска замены, для дальнейшего использования.

Один раз создав шаблон ненужных атрибутов вам останется вставлять страницы или фрагмент кода с одного сайта ( для другого сайта потребуется новый шаблон ) и нажимать на две кнопки.

Работает оффлайн.

Поддерживает русскую кадрировку.

Скачать можно отсюда

В архиве краткая инструкция в картинках по использованию.

M2
На сайте с 15.11.2010
Offline
3
#1

возможности неплохие, спасибо, но рекомендую сразу прикладывать ссылку на Вирустотал в для бОльшего доверия к скачиваемому файлу

Получи 35 изображений бесплатно, а остальные - за полцены! (http://goo.gl/mpkUZ)
NA
На сайте с 24.01.2009
Offline
57
#2

Microne2010 спасибо за комментарий. Сылка на Dr.Web.

Основной задачей было проверить если сборка работает на других машинах,так как запускалась только на моей системе Windows 7

[Удален]
#3

Спасибо. Хорошая прога. До этого пользовался онлайн сервисами. По работе все норм, только вот единственное у меня теги <span> автоматически не определяет т.е. вот код после вставки из ворда


<p class="MsoNormal" style="margin: 0cm 0cm 10pt;"><span style="font-size: small; font-family: Calibri;">Применение твердотельных накопителей (<span style="mso-ansi-language: EN-US;">SSD</span> &ndash; <span style="mso-ansi-language: EN-US;">Solid</span><span> </span><span style="mso-ansi-language: EN-US;">State</span><span> </span><span style="mso-ansi-language: EN-US;">Drive</span>) в ноутбуках имеет ряд значительных преимуществ перед обычными жесткими дисками. Здесь и высокая производительность, низкое энергопотребление, устойчивость к физическим воздействиям. Но сегодня, широкому применению данных накопителей информации мешают высокая цена и ряд ограничений и особенностей. Количество <span style="mso-ansi-language: EN-US;">SSD</span>-дисков пока еще мало по сравнению с традиционными винчестерами. Но определенные достижения есть. Так, например, в 2010 году цена на твердотельный накопитель начального уровня снизилась до 99 долларов.</span></p>

Нажимаю Generate Words


class="MsoNormal" style="margin: 0cm 0cm 10pt;"
style="font-size: small; font-family: Calibri;"
style="mso-ansi-language: EN-US;"

<span>, </span> - вручную дописываю, нажимаю Replace Words и все очищается.

<p >Применение твердотельных накопителей (SSD &ndash; Solid State Drive) в ноутбуках имеет ряд значительных преимуществ перед обычными жесткими дисками. Здесь и высокая производительность, низкое энергопотребление, устойчивость к физическим воздействиям. Но сегодня, широкому применению данных накопителей информации мешают высокая цена и ряд ограничений и особенностей. Количество SSD-дисков пока еще мало по сравнению с традиционными винчестерами. Но определенные достижения есть. Так, например, в 2010 году цена на твердотельный накопитель начального уровня снизилась до 99 долларов.</p>

А так иногда очень полезная программа. Система Windows XP SP2.

NA
На сайте с 24.01.2009
Offline
57
#4

r.yevgeniy Спасибо за комментарий.

Функция Generate Words была добавлена совсем не давно, до этого все собралось в ручную и вставлялось в набор для замены. Generate Words собирает только атрибуты тегов. Во всяком случае принял на заметку, если кому еще понадобится избавится от <span то дополню программу.

Shlackbaum
На сайте с 18.08.2010
Offline
322
#5
nick_alex_95:
Поддерживает русскую кадрировку.

Ну если ЕЕ поддерживает, родимую, то беру. Куда ж без кадрировки-то русской

P.S. Хотя за любую халяву спасибо - может кому и сгодится

Пустота. Какого черта здесь появляется чья-то реклама?
NA
На сайте с 24.01.2009
Offline
57
#6

Shlackbaum Спасибо за комментарий, с кодировкой пришлось помучится текст - изначально копируется в файл после чего по битам считывается не зависимо от кодировки и конвертируется в UTF 8

ED
На сайте с 09.11.2010
Offline
5
#7

Если можно , перезалейте программу

Bitman
На сайте с 05.07.2009
Offline
112
#8

Ссылка не работает :(

Северный лес (https://euro-vagonka.by) DREW (https://drew.by) AvtoDrive (https://avtodrive.by)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий