Бесплатный парсер вебархива

12
C
На сайте с 18.03.2013
Offline
1
2996

Написал простой скрипт парсер веб-архива, качайте кому надо. Также предлагайте мысли что дописать в нем.

B
На сайте с 18.03.2008
Offline
47
#1

Спасибо, посмотрим.

jcrush
На сайте с 04.07.2004
Offline
371
#2

экспорт в популярные движки

» Блог (http://blog.stfw.ru/) - SEO-заметки. ДВчат: @dvchat (https://t.me/dvchat)
D
На сайте с 23.05.2011
Offline
21
#3

создание шаблонов для доргенов

eN_Slon
На сайте с 13.02.2007
Offline
159
#4
codemuseum:
Также предлагайте мысли что дописать в нем.

Даешь адрес. Он выдирает с архива все страницы и имаджи. Если что-то отсутствует - берет в снепшотах за другие даты, если есть. Далее например на DLE делает сайт с сохранением урлов. Отсутствующие страницы, картинки заменяет неуником с ПС например, ну или удаляет ссылки на них и их упоминания.

Парсинг, граббинг, автоматизация всего что вы можете сделать в браузере(и не только) сами. Любое кол-во, любые защиты.
C
На сайте с 18.03.2013
Offline
1
#5

eN_Slon, мысль хорошая, в свободное время буду дорабатывать скрипт! По результататм работы отпишусь тут.

C
На сайте с 18.03.2013
Offline
1
#6

Исправил глюки скрипта + добавил форму для быстрого поиска страниц сайта в архиве + перезалил архив со скриптом. Качайте кому надо.

---------- Добавлено 20.03.2013 в 02:08 ----------

Дайте какой нибудь сложный сайт для тестов скрипта плиз.

eN_Slon
На сайте с 13.02.2007
Offline
159
#7

codemuseum, киньте мне в личку Вашу асю. Могу Вас координировать начиная с завтрашнего дня.

C
На сайте с 18.03.2013
Offline
1
#8

eN_Slon, не могу пока в приват писать

TF-Studio
На сайте с 17.08.2010
Offline
334
#9

Для начала, советую открыть для себя UTF-8

и хорошо бы сохранять все, делать копии сайтов, вычищенные.

Но за идею плюсую, пойду напишу себе полный парсер.

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).
C
На сайте с 18.03.2013
Offline
1
#10

TF-Studio, спасибо! с UTF я знаком, а полные копии сайтов будут, нужно для начала на разнотипных сайтах скрипт протестить..

Удачи в разработке! :)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий