Восстановление сайта из вебархива

OP
На сайте с 31.01.2015
Offline
2
1629

Товарищи приветствую. собственно такое дело, нужно поднять из вебархива большой сайт, порядка 5к страниц, сайт имеет определенную ценность, отсюда вопрос как это сделать?

знаю про сервис http://r-tools.org который восстанавливает сайт на выходе мы получаем архив с сайтом в виде html файлов, но это не особо удобно в плане будущей работы с сайтом, администрированием и прочим... отсюда как то хотелось восстановить (спарсить) материал с категориями и сохранение УРЛов (если это возможно) и импортировать это все в цмс, скажем dle. до этого сайт так же был на cms dle.

если есть какие то скрипты и прочее подскажите, выслушаю предложения, если кто может помочь за копейку :idea:

The WishMaster
На сайте с 29.09.2005
Offline
2542
#1
ORC-Phoenix:
отсюда как то хотелось восстановить (спарсить) материал с категориями и сохранение УРЛов (если это возможно) и импортировать это все в цмс, скажем dle.

Готовых решений нет, скорее всего. Закажи программисту скрипт.

Пешу текста дешыго! Тематики - туризм, СЕО, творчество, кулинария, шизотерика :)
M0
На сайте с 24.07.2009
Offline
192
#2

а что, вебархив сохраняет такое большое количество страниц? я думал он делает снимки лишь некоторых страниц, но не 5К

lenya91
На сайте с 30.01.2015
Offline
2
#3

ORC-Phoenix, Так а вы сами проверили, есть ли в вебархиве все 5к страниц? Если да то продолжим, есть специальные сервисы для этого.

OP
На сайте с 31.01.2015
Offline
2
#4

The WishMaster, если так, то спасибо. будем искать человека.

Mvk09, не так давно поднял сайт, порядка 1к страниц вытащил, у данного проекта, при мельком пробеге тоже довольно большое количество страниц сохранилось! за все случаи не берусь говорить, но время от времени я думаю попадаются сайты с больним количеством страниц

---------- Добавлено 18.02.2015 в 22:13 ----------

lenya91, 5к конечно врят ли будет, но даже если будет порядка 2-2.5к сохраненных страниц, ручками в ручную вообще не айс.

The WishMaster
На сайте с 29.09.2005
Offline
2542
#5

А ты сайт обновлять потом собираешься, что ли? rtools выдают в удобном виде, тупо залил на хостинг и все работает. Для размешения кодов и т. п. можно сделать инклуд.

87793
На сайте с 12.09.2009
Offline
661
#6
The WishMaster:
А ты сайт обновлять потом собираешься, что ли?

Откуда такое удивление? 😕

Наше дело правое - не мешать левому!
The WishMaster
На сайте с 29.09.2005
Offline
2542
#7
87793:
Откуда такое удивление?

Обычно из вебархива сайты восстанавливаются очень криво и используются как сателлиты.

OP
На сайте с 31.01.2015
Offline
2
#8
The WishMaster:
А ты сайт обновлять потом собираешься, что ли? rtools выдают в удобном виде, тупо залил на хостинг и все работает. Для размешения кодов и т. п. можно сделать инклуд.

вообще по сути проект стараюсь поднимать, естественно все что криво, пытаюсь править руками

eN_Slon
На сайте с 13.02.2007
Offline
159
#9

Тут полуавтомат. Человек шаблон сам на ДЛЕ делает на основе того, который в архиве, потом робот забирает контент(статьи и картинки если есть) и постит с сохранением урлов. Страницы типа "контакты" тоже вручную.

Парсинг, граббинг, автоматизация всего что вы можете сделать в браузере(и не только) сами. Любое кол-во, любые защиты.
OP
На сайте с 31.01.2015
Offline
2
#10
eN_Slon:
Тут полуавтомат. Человек шаблон сам на ДЛЕ делает на основе того, который в архиве, потом робот забирает контент(статьи и картинки если есть) и постит с сохранением урлов. Страницы типа "контакты" тоже вручную.

не могли бы подсказать по подробней, по поводу того,

потом робот забирает контент(статьи и картинки если есть) и постит с сохранением урлов

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий