Идея - сервис по серфингу по кэшированным страницам сайтов

anser06
На сайте с 11.03.2006
Offline
276
731

Поскольку многие сайты ддосят, некоторые надолго падают из-за кривого хостинга, не продления доменов и т.д., становится актуальным чтение кэшированных страниц этих сайтов, например, в Гугле. Но переходить по ссылкам не получится - они ведут на сам сайт, а не кэшированную версию.

Существует ли сервис, который позволяет ходить по кэшированным версиям страниц так же, как по самому сайту? Чтобы можно было выбирать поисковик, определялась дата сохраненки, количество страниц в кэше.

Вебархив не предлагать - у него другое предназначение: сохранить вид сайтов для будущих внуков.

Такой сервис нужен?

да, будет востребован
25% (3)
да, но мало кому понадобится
17% (2)
нет, пользы никакой
0% (0)
нет: хотя смысл есть, но никто не будет пользоваться
8% (1)
кто здесь? / не знаю / спросите лучше у Онотоле
50% (6)
Всего проголосовало: 12
Mik Foxi
На сайте с 02.03.2011
Offline
1028
#1

если юзать хром - то зайдя на страницу, которая не открывается и если у нее есть кеш в гугле - гугл предлагает посмотреть ее кеш.

Антибот, антиспам, веб файрвол, защита от накрутки поведенческих: https://antibot.cloud/ru.html + партнерка, до 40$ с продажи.
anser06
На сайте с 11.03.2006
Offline
276
#2
foxi:
гугл предлагает посмотреть ее кеш.

вариант неплохой, только лишних телодвижений многовато.

Mad_Man
На сайте с 10.11.2008
Offline
162
#3
anser06:
Существует ли сервис, который позволяет ходить по кэшированным версиям страниц так же, как по самому сайту? Чтобы можно было выбирать поисковик, определялась дата сохраненки, количество страниц в кэше.

Предлагаете реализовать связку текст+картинки, в то время как TinEye и ВебАрхив при нехилом финансировании еле справляются?

anser06:
Но переходить по ссылкам не получится - они ведут на сам сайт, а не кэшированную версию.

webcache.googleusercontent.com/search?q=cache:http://url.ru
anser06
На сайте с 11.03.2006
Offline
276
#4
Mad_Man:
Предлагаете реализовать связку текст+картинки, в то время как TinEye и ВебАрхив при нехилом финансировании еле справляются?

Картинки и текст будут браться из индекса поисковиков. Сам сервис должен только подменять все ссылки на аналогичные из кэша.

Mad_Man
На сайте с 10.11.2008
Offline
162
#5
anser06:
Картинки и текст будут браться из индекса поисковиков. Сам сервис должен только подменять все ссылки на аналогичные из кэша.

Проставить webcache.googleusercontent.com/search?q=cache: перед всем, что начинается с http не трудно, тем более не очень трудно проверять заголовки на наличие 200-й. Могу написать на php, но популярность сервиса сомнительна и постоянно нужны свежие прокси.

anser06
На сайте с 11.03.2006
Offline
276
#6
Mad_Man:
Могу написать на php, но популярность сервиса сомнительна

Разве вам не попадаются интересные, но лежащие сайты? :)

Mad_Man:
и постоянно нужны свежие прокси.

Таки да. Но если не чекать на код 200, а просто менять ссылки вслепую, то будет работать и без прокси.

P.S. Добавил голосовалку.

arkadiy_a
На сайте с 11.06.2008
Offline
82
#7
Mad_Man:
Проставить webcache.googleusercontent.com/search?q=cache: перед всем, что начинается с http не трудно, тем более не очень трудно проверять заголовки на наличие 200-й. Могу написать на php, но популярность сервиса сомнительна и постоянно нужны свежие прокси.

Нет, там сложней желательно сделать: многопоточную проверку - есть ли страница по ссылке в кеше или нет. Если нет - помечать (цветом, иконкой, фоном, видом курсора) недоступность ссылки.

2ТС - имхо в виде cgi-proxy севис сделать самое то. Ведь так универсальней будет. Просто серфить по кешу - обычный сервис.

А вот возможность восстановления сайтов из кеша с помощью телепорта какого-нибудь - можно сделать платной опцией (например, в бесплатной ограничение: недоступные ссылки как-нибудь стремно помечаются, чтобы нельзя было использовать в продакшене)

Имхо полезный был бы сервис, я бы пользовался.

arkadiy_a добавил 23.06.2011 в 01:45

anser06:
Разве вам не попадаются интересные, но лежащие сайты?

Сеошникам, при ручном отборе доноров, учитывая среднебольничные цифры (ну например 99.5%) по доступности сайтов, временно лежащих сайтов в день пара-тройка набирается.

Чтобы не помечать себе "зайти позже на сайт", можно по кешу примерно понять, - насколько потенциальный донор похож на гс.

anser06
На сайте с 11.03.2006
Offline
276
#8

я не собираюсь разрабатывать такой сервис, так что если кто возьмется - милости просим. Пользовался бы сам и давал бесплатные советы по улучшению функционала.

Никанет
На сайте с 26.07.2010
Offline
131
#9

думаю, если б был, люди пользовались бы. а вообще, такие вопросы нужно проверять на практике - тогда ответ более точный.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий