Ищу программу, которая режет html-файлы по заданному шаблону

R
На сайте с 04.03.2004
Offline
63
575

Ищу программу, которая режет html-файлы (или текстовые - без разницы) по заданному шаблону.

Есть html-файл, его нужно порезать на несколько десятков текстовых файлов разного размера. Начало каждого нового файла определяется определенным набором символов.

Например, есть файл:

111апвлоф

32паврф

плав

111оплаовф

111авыфолавоф

арлвды

111ооо

Нужно сделать 4 файла:

111апвлоф

32паврф

плав

111оплаовф

111авыфолавоф

арлвды

111ооо

Везде искал, нашел кучу программ для разрезания по заданному размеру, а того, что мне надо, не нашел.

Наверняка кто-то сталкивался с подобной проблемой?

J
На сайте с 02.02.2009
Offline
53
#1

Perl:


my $i = 1;
while($content =~ /111(.*?)\n/mg){
open FF, "< $i";
print FF $1;
close FF;
$i++;
}
zzeus
На сайте с 04.01.2008
Offline
74
#2

Для работы потребуется Python. (на хостинге обычно есть)

сохраняете как splitter.py

ставите:

TARGET - файл откуда читать

SPLIT - по чему резать

записывает результаты в 1.txt, 2.txt и т.д.

TARGET = 'file.txt'
SPLIT = '1111'

text = open(TARGET,'r').read()
parts = text.split(SPLIT)
i = 1
for part in parts:
open(str(i)+'.txt', 'w').write(part)
i += 1

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий