Удалить(вырезать) ненужные(нужные) строки из большого кол-ва HTML файлов.

J4
На сайте с 21.05.2009
Offline
99
6351

Имеется очень много HTML файлов, содержащих "лишние" строки. Как можно быстро очистить контент от ненужных строк? С помощью проги notepad++? Как? Все файлы естественно имеют одинаковую структуру.

Также интересен 2-й вариант: вырезать строки ограниченные определёнными тегами со всех хтмл страниц(на каждой странице 3-4 поста ограниченные известными тегами).

Спасибо за помощь.

[Удален]
#1

с помощью нотепада++ не знаю как это сделать

пробуй powergrep + регулярные выражения

WEB_Spb
На сайте с 21.06.2007
Offline
35
#2

Словогрыз - пакетная обработка файлов, возможность создания сценария (группы замен), используя регулярные выражения.

_
На сайте с 24.07.2002
Offline
299
_Ad
#3

пакетная обработка встроена в Dreamweaver.. Наверняка у вас адобовский пакет стоит.. даже искать ничего не надо. в "замену" вставляете строчку, которую нужно убрать, выбираете папку, где файлики лежат и запускаете.. все гениальное просто.

[Удален]
#4

_Ad, самый рульный метод. Дримвивер рулит )) в макромедии все те же функции есть

[Удален]
#5

Классика:)

HTMLChanger v2.6b1

Программа для поиска и замены текста в множестве файлов: по шаблону, в различных кодировках. Существует возможность конвертировать файлы.

скачать:http://freesoft.ru/?id=2873

WEB-мастер
На сайте с 23.07.2009
Offline
174
#6

Adobe Dreamweaver

Найти/заменить.

Хоть на всем компе найдет и заменит)

Лучший парсер ( https://goo.gl/aw7tPJ ) чего угодно.
J4
На сайте с 21.05.2009
Offline
99
#7

Всем спасибо огромное за помощь. Контент полностью очищен от мусора, теперь осталось уникализировать качественно его))))

_
На сайте с 24.07.2002
Offline
299
_Ad
#8

стырили сайт и поубирали каменты юзеров? (просто интересно)..

все равно яндекс забанит.. очень много страничек уникализировать - дохлый номер. Синонимайзеры не работают, потому как шингловую проверку этим не обманешь.. Зря старались, в общем..

J4
На сайте с 21.05.2009
Offline
99
#9

Сайт слил с помощью проги content downloader pro от smartbyte. Стырил сразу без коментов, но кое что лишнее есть, явасрипты и кое какой ещё мусор, я с граббером пока не доконца разобрался. Насчёт уникализации свою тему палить не буду. Для меня был важен лиш чистый контент текст и картинки к статьям. Также есть платный способ уникализации, прогоняешь контент синонимайзером и отдаёшь челу который поправляет текст руками. Если не ошибаюсь на сёрче есть такая тема "Рерайт машинного рерайта" , чел рерайтит машинный текст за 7 руб. 1к символов.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий