оффлайн-парсинг - как получить title из 50k html файлов с HDD?

Stravinsky
На сайте с 06.09.2007
Offline
110
820

Чем можно? Юзаю Textpipe для массового редактирования, но там в основном удаление-замена, а нужно достать title всех файлов в отдельный список. Такой оффлайн парсинг

Оптимизайка
На сайте с 11.03.2012
Offline
396
#1


sed -n 's/<title>\(.*\)<\/title>/\1/p' *.html | sed 's/^[ \t]*//;s/[ \t]*$//'
⭐ BotGuard (https://botguard.net) ⭐ — защита вашего сайта от вредоносных ботов, воровства контента, клонирования, спама и хакерских атак!
Stravinsky
На сайте с 06.09.2007
Offline
110
#2
Оптимизайка:

sed -n 's|<title>\(.*\)</title>|\1|p' *.html | sed 's/^[ \t]*//;s/[ \t]*$//'

а где это вводить?

Оптимизайка
На сайте с 11.03.2012
Offline
396
#3
Stravinsky:
а где это вводить?

в командной оболочке (терминале), где же ещё

AE
На сайте с 28.08.2007
Offline
121
#4
Оптимизайка:
в командной оболочке (терминале), где же ещё

Вот ты мозг, а я бы наверно парсер стал писать :)

Узнай больше о Coca-Cola (https://www.coca-cola.ru/product?ref=17)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий