- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Всем привет. У меня есть форум. Форуму уже несколько лет и за это время многие темы были мной удалены по требованию пользователей (например, как клеветнические и т.п.). Но сейчас я обнаружил, что на сайте archive.org все это хранится и отображается в общем доступе.
Я написал письмо и отправил с почты своего сайта с просьбой удалить , как рекомендуют тут: https://wpuse.ru/how-to-removing-site-from-internet-archive.html Прошла неделя, но ответа так и не поступило. Может прошло мало времени? Кстати в статье написано, что был официальный анонс от разработчиков сервиса, в котором указывалось, что впредь сканирующий страницы робот будет игнорировать директивы в robots.txt.
Ком-нибудь сталкивался с таким вопросом?
Обычно неделя или чуть больше нужно на удаление. Им весь интернет пишет, твоё письмо просто еще в очереди стоит. Ты же на английском писал?
По состоянию на прошлую неделю archive.org не игнорирует robots.txt.
Ты же на английском писал?
Да, на английском конечно - как в примере.
archive.org не игнорирует robots.txt.
Я еще читал, что директивы в robots.txt, это временная мера. После удаления robots.txt по тем или иным причинам, слепок сайта в архиве восстанавливается. А мне нужно, чтобы архив сайта был удален совсем.
На будущее просто запретите им доступ. Мои сайты им отдают 403ю ошибку
Обычно неделя или чуть больше нужно на удаление.
Да, так и оказалось. Около недели.
Пришел ответ:
The sites/URLs referenced in your email have now been submitted for
exclusion from the Wayback Machine at http://www.archive.org/web.
Please allow up to a day for the automated portions of the process to
run their course and for the changes to take effect. If you have any
other questions or concerns, please let us know.
--
The Internet Archive Team
а на сайте архива: