Вытаскивание сайта из веб-архива. Кто как делает?

T

101

telemad

15 января 2009, 09:50

732

Добрый день.

Допустим, требуется востановить сайт из веб-архива.

Вбиваю на web.archive.org ссылку на морду сайта, получаю табличку со списком сохраненных версий, разбитый по датам.

Выбираю сохраненную версию за какую-либо дату.

Открылась морда, сохраненная на вебархиве, но некоторые внутренние ссылки на этой странице ведут на сохраненные версии для другой даты.

Как поступить? Не обращать внимания на разницу дат и вытаскивать все страницы? Но ведь они могут дублироваться (более свежие и более старые, сохраненные на вебархиве).

Кто как делает?

Сорри, если сумбурно описал.

[Удален]

15 января 2009, 10:03

#1

WebZip и фильтр по урл (дата в урле передается)

T

101

telemad

15 января 2009, 10:26

#2

neolord:
WebZip и фильтр по урл (дата в урле передается)

Спасибо. Т.е. вытаскивать из вебархива все, что доступно за казанную дату в урле?

А если страницы за указанную дату в вебархиве нет, но эта страница есть за другую дату (более раннюю или позднюю), ее тоже надо вытягивать, чтобы полностью сайт восстановить?

Или сайт восстанавливается только для самой свежей версии?

Как увеличить ИКС? Количество внешних ссылок Google Search Console -

[Удален]

15 января 2009, 10:58

#3

Нет, там у каждой страницы своя хистори. Ну работа конечно ручная, но скрипт вполне осилит.

T

101

telemad

15 января 2009, 11:04

#4

neolord:
Нет, там у каждой страницы своя хистори. Ну работа конечно ручная, но скрипт вполне осилит.

Все понятно. Спасибо!

Яндекс Вебмастер вынес товарные фиды в отдельный раздел

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ