Вытаскивание сайта из веб-архива. Кто как делает?

T
На сайте с 19.12.2006
Offline
101
717

Добрый день.

Допустим, требуется востановить сайт из веб-архива.

Вбиваю на web.archive.org ссылку на морду сайта, получаю табличку со списком сохраненных версий, разбитый по датам.

Выбираю сохраненную версию за какую-либо дату.

Открылась морда, сохраненная на вебархиве, но некоторые внутренние ссылки на этой странице ведут на сохраненные версии для другой даты.

Как поступить? Не обращать внимания на разницу дат и вытаскивать все страницы? Но ведь они могут дублироваться (более свежие и более старые, сохраненные на вебархиве).

Кто как делает?

Сорри, если сумбурно описал.

[Удален]
#1

WebZip и фильтр по урл (дата в урле передается)

T
На сайте с 19.12.2006
Offline
101
#2
neolord:
WebZip и фильтр по урл (дата в урле передается)

Спасибо. Т.е. вытаскивать из вебархива все, что доступно за казанную дату в урле?

А если страницы за указанную дату в вебархиве нет, но эта страница есть за другую дату (более раннюю или позднюю), ее тоже надо вытягивать, чтобы полностью сайт восстановить?

Или сайт восстанавливается только для самой свежей версии?

[Удален]
#3

Нет, там у каждой страницы своя хистори. Ну работа конечно ручная, но скрипт вполне осилит.

T
На сайте с 19.12.2006
Offline
101
#4
neolord:
Нет, там у каждой страницы своя хистори. Ну работа конечно ручная, но скрипт вполне осилит.

Все понятно. Спасибо!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий