Проиндексировался закрытый от индексации сайт.

Простокот
На сайте с 12.02.2012
Offline
30
1042

Здравствуйте, есть сайт на поддомене, закрытый от индексации в robots.txt

User-agent: *

Disallow: /

а также закрытый для всех в .htacess

Order deny,allow

deny from all

Allow from (тут несколько своих IP)

Кроме этого в robots.txt также закрыт и основной домен. Но сайт все равно в полном объеме проиндексировался гуглом. Это нормально? Как его удалить из индекса? Неделю назад попробовал добавить адреса Инструменты для веб-мастеров -> Удалить URL-адреса, но до сих пор ничего не удалилось.

S6
На сайте с 06.12.2011
Offline
158
SEO
#1
Простокот:


Кроме этого в robots.txt также закрыт и основной домен. Но сайт все равно в полном объеме проиндексировался гуглом. Это нормально? Как его удалить из индекса? Неделю назад попробовал добавить адреса Инструменты для веб-мастеров -> Удалить URL-адреса, но до сих пор ничего не удалилось.

В выдаче страницы с флагом о запрете индексации или нет?

Аудит сайта. Консультации.
E
На сайте с 21.09.2009
Offline
283
#2

По форуму, пробовали искать ответ на вопрос? 100500 раз уже писано, что роботс не управляет индексом, а только сканированием.

зачем удаляете сайт? Удаление делается не сразу, а через какое-то время. Можете вбить в удаление знак /(слеш) и бот удалит весь сайт. Только сначала хорошо подумайте, он удалит его на 90 дней.

R
На сайте с 26.09.2013
Offline
27
#3
Простокот:
Здравствуйте, есть сайт на поддомене, закрытый от индексации в robots.txt
User-agent: *
Disallow: /
а также закрытый для всех в .htacess
Order deny,allow
deny from all
Allow from (тут несколько своих IP)

Кроме этого в robots.txt также закрыт и основной домен. Но сайт все равно в полном объеме проиндексировался гуглом. Это нормально? Как его удалить из индекса? Неделю назад попробовал добавить адреса Инструменты для веб-мастеров -> Удалить URL-адреса, но до сих пор ничего не удалилось.

для гугла это норма

в большинстве своем он все-таки соблюдает роботс. но если на сайт, даже закрытый, есть ссылки то он туда полезет ни смотря ни на что

Аудит сайтов - почему не лезет и почему улетел. Анализ конкурентов. Снятие санкций от Google ЛС
Простокот
На сайте с 12.02.2012
Offline
30
#4
SEO66:
В выдаче страницы с флагом о запрете индексации или нет?

Нет ничего такого нету. Обычные страницы.

---------- Добавлено 14.03.2014 в 16:03 ----------

easywind:
По форуму, пробовали искать ответ на вопрос? 100500 раз уже писано, что роботс не управляет индексом, а только сканированием.
зачем удаляете сайт? Удаление делается не сразу, а через какое-то время. Можете вбить в удаление знак /(слеш) и бот удалит весь сайт. Только сначала хорошо подумайте, он удалит его на 90 дней.

Удаляю т.к. делать в индексе ему нечего. Это сайт для внутреннего пользования с не публичной информацией. Домен используется для почты, и слишком любознательные могут увидеть ненужное. Сейчас сайт уже скрыт за паролем, но часть страниц успела попасть в кэш гугла за те несколько дней, пока доступ был открыт. В целом ничего страшного, что он в индексе, но в идеале хочется, чтобы его там не было.

В общем буду пробовать еще через какое-то время. Но неужели неделя это мало?

Rndom, никаких ссылок на него нету. Честно говоря ума не приложу как гугл его нашел. Разве что в переписке на gmail.

R
На сайте с 26.09.2013
Offline
27
#5
Простокот:
Разве что в переписке на gmail.

вот вам и ответ :)

в следующий раз баньте бота по айпи от греха подальше

Z0
На сайте с 03.09.2009
Offline
827
#6
Rndom:
для гугла это норма
в большинстве своем он все-таки соблюдает роботс. но если на сайт, даже закрытый, есть ссылки то он туда полезет ни смотря ни на что

Как он может проиндексировать что-то на сайте с запретом через htaccess ? 🤪 deny from all - отдает всем 403 ошибку... Или я что-то путаю?

Простокот:

а также закрытый для всех в .htacess

.htacess у вас или .htaccess ?

_
На сайте с 20.10.2006
Offline
197
#7
Простокот:
В целом ничего страшного, что он в индексе, но в идеале хочется, чтобы его там не было.

- Добавляете указание Noindex для роботов в код страницы и вы спасены )можно конечно вручную убрать урл из индекса - добавив его в панель Гугла, но не думаю что у вас там уж очень секретная информация чтобы ускоренно убирать из кеша )

Вечные ссылки на качественных англоязычных площадках. (/ru/forum/883099) Результат гарантирую!
Простокот
На сайте с 12.02.2012
Offline
30
#8
ziliboba0213:

.htacess у вас или .htaccess ?

.htaccess конечно. Хотя deny в .htaccess возможно уже после индексации прописали, так что этот пункт из моего вопроса можно убрать. Но в robots.txt Disallow было изначально, и я раньше был уверен, что этого достаточно чтобы поисковые боты не индексировали сайт. А сегодня обнаружил его полностью в индексе и был удивлен.

_aleksey_, В вебмастере уже неделю как добавил на удаление, и ничего не изменилось, но пока подожду еще.

Вопрос. А ПС сами удаляют сайты из индекса, если находят в robots.txt рекомендацию Disallow: / ?

E
На сайте с 21.09.2009
Offline
283
#9
Простокот:
Это сайт для внутреннего пользования с не публичной информацией. Домен используется для почты, и слишком любознательные могут увидеть ненужное.

Понял. Тогда все правильно делаете. Закрывайте в роботс, чтобы не сканировал и удаляйте через ВМТ с слешем весь сайт.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий