Дубли на поддомене

R
На сайте с 22.06.2007
Offline
174
1231

По нелепой ошибки в днс в индекс попали страницы вида http://mail.site.ru/..., которые являются дублями страниц без поддомена http://site.ru/...

Ошибку в днс уже устранил, по этим адресам выдается 404. Но вопрос в том, как их удалить с индекса.

Сперва я подумал, что будет несложно: пропишу запрет в роботс, удалю ненужные страницы в панели вебмастера. Ага ... не тут то было.

Даже не думал, что через robots.txt запрет поддомена будет сложно осуществить. Гуглил на эту тему - информации не нашел. Теперь уже сомневаюсь, что это возможно...

В панели вебмастера тоже засада.

В пв гугла сайта site.ru можно только удалять страницы, которые начинаются site.ru/... А как удалить страницы поддомена? Уже даже появились мысли, что стоит добавлять поддомен как отельный сайт и там уже удалять :)

Здесь http://webmaster.yandex.ru/delurl.xml тоже проблема: при попытке удалить по адресу mail.site.ru выдается Сервер недоступен, что в принципе и правильно, так как там действительно 404.

Жду советов гуру серча.

xpycteamset
На сайте с 05.10.2009
Offline
129
#1

Подождать сами вылетят.

R
На сайте с 22.06.2007
Offline
174
#2
xpycteamset:
Подождать сами вылетят.

Это понятно. Хотелось бы прискорить этот процесс. Сайт то просел.

Все таки сделал пока так: временно восстановил в днс запись mail, чтобы добавить поддомен mail.site.ru в панели вебмастера яши и гугла, подтвердил права метатегом и добравлся до инструментария удаления. Но проблема в том, что и в яндексе и в гугле есть возможность ввода только по одному урл-у. А что делать, если страниц несколько тысяч?

Как отправить на удаление сразу группу страниц, может можно по маске?

Может кто сталкивался с подобным.

R
На сайте с 22.06.2007
Offline
174
#3

Сделал следующее.

Настроил домен mail.site.ru с robots.txt с содержанием:

User-agent: *

Disallow: /

Также позаботился о том, чтобы морда поддомена отвечала 403 (может было бы еще лучше 404, но как это сделать не знал), остальные страницы вида mail.site.ru/... при этом отдавали 404.

Затем добавил в ПВ гугла и яндекса поддомен. Воспользовался инструментом удаления страниц. Для обеих пс удалили весь сайт mail.site.ru. В яндексе пока ничего не выпало, но и апдейтов еще не было. В гугле все супер - все дубли (17 тысяч страниц) через 2 дня выпали. Жду яндекс.

П.С. Сложилось впечатление, что общаюсь сам с собой :) Но описал решение проблемы - возможно кому-то пригодится...

SAlex
На сайте с 27.07.2008
Offline
409
#4

На поддомене зеркало - это нормально (ничего страшного).

сайт просел не из-за этого. копайте в другом месте.

R
На сайте с 22.06.2007
Offline
174
#5
SAlex:
На поддомене зеркало - это нормально (ничего страшного).

С чего вы взяли. С каких это пор дубли это нормально. Есть даже буржуйская статья на тему исследования сабжа (к сожалению ссылку сходу не вспомню), где в выводах говорилось примерно следующее.

Логика гугла такая:

Почему я должен индексировать дубли, да еще и дубли с одного и того же сайта, забивая свои винты повторяющимся контентом :)

То есть как бы дубли в рамках одного сайта это даже похуже копипаста из сети...

Даже частичные дубли - это уже зло, а полные - это уже имхо большая проблема.

Что-то в этом духе.

SAlex
На сайте с 27.07.2008
Offline
409
#6

Погугли "зеркало сайта"

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий