самый грамотный способ закрыть зеркало

12
Ceres
На сайте с 28.09.2004
Offline
389
5441

Проблема уже обсуждалась:

Нужно запретить зеркало сайта - домен третьего уровня на том же хостинге, что и основной сайт - домен второго уровня.

Из того что я нашел через поиск:

1. можно в robots.txt добавить Host: www.site.ru

User-Agent: *

Host: www.site.ru

(таки образом как я понимаю domen.site.ru - будет не запрещен к индексации, а склеин?)

2. Если сервер Apache, то можно вместо использования директивы Host задать robots.txt с использованием директив SSI:

<!--#if expr=" \"${HTTP_HOST}\" != \"www.site.ru\" " -->

User-Agent: *

Disallow: /

<!--#endif -->

(в этом случае domen.site.ru будет запрещен к индексации?)

3. На домен-зеркало третьего уровня прописать свой robots.txt

Host: domen.site.ru

User-Agent: *

Disallow: /

(в этом случае domen.site.ru будет запрещен к индексации?)

4. Использовать одновременно 1-ый и 3-ий способы.

Собственно вопрос: Какой из вышеперечисленных способ наиболее грамотный и правильный?

Там чу-де-са! )
C
На сайте с 19.09.2001
Offline
120
#1

Если есть возможность, то для domen.site.ru положить свой robots.txt, в котором написать следующее:

User-agent: *

Disallow: /

Host: www.site.ru

В этом случае Яндекс приклеит domen.site.ru к www.site.ru, а остальные поисковики его просто не будут индексировать.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
AiK
На сайте с 27.10.2000
Offline
257
AiK
#2
В этом случае Яндекс приклеит domen.site.ru к www.site.ru, а остальные поисковики его просто не будут индексировать.

Это не соответствует действительности. Некоторые поисковики абсолютно справедливо будут игнорировать директиву Disallow: / как размещённую в неверно оформленной секции. Проверено на личном поыте. Поэтому правильнее составить для зеркала такой robots.txt:


User-agent: *
Disallow: /

User-agent: Yandex
Disallow: /
Host: www.site.ru
Ceres
На сайте с 28.09.2004
Offline
389
#3

Cherny, AiK, спасибо большое за ответы.

Но оказывается домен и поддомен лежат на одном хостинге, и используют одну базу, правда в разных папках. Домен в папке htdocs, а поддомен в отдельной папке. Будет ли в этом случае верным заливать и туда и туда разный robots.txt?

Уж очень не хочется из-за этого потом проблемы с индексацией получить.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#4

Блин. Мой склероз меня подводит :( Деректива Host работает только в том случае, если robots.txt идентичен на обоих сайтах.

Иначе, например, вот такой robots.txt

http://www.h12.ru/robots.txt


User-agent: Yandex
Disallow:
Host: www.holm.ru

User-agent: *
Disallow:

мог бы повлечь за собой склеивание всех поддоменов у хостера. Правда скорее всего зеркальщик, не найдя соответствия между сайтами, просто игнорировал бы директиву Host.

Так что если robots.txt разные, то директива Host не нужна - просто домен закрывается от индексации, если нужно конечно.

А если они одинаковые, то в моём примере следует оставить пустой директиву Disallow (ну или запрещать только то, что реально нужно всем запретить).

Ceres
На сайте с 28.09.2004
Offline
389
#5

реально нужно запретить весть домен третьего уровня - он является точной копией основного сайта, только другим по дизайну.

в качестве примера:

http://www.rambler.ru/

http://classic.rambler.ru/ Только если у Рамблера это всего лишь копия главной, то у меня весь сайт.

Что-то я них там не увидел robots.txt на поддомене?

Ceres
На сайте с 28.09.2004
Offline
389
#6

Такс, вот еще один пример:

http://www.inosmi.ru/

http://www.inosmi.ru/text/

здесь они не другой дизайн, а тектовую версию сделали, и не через поддомен, а через директиву /text/

robots.txt я у них опять таки не вижу.

B
На сайте с 07.10.2004
Offline
114
#7
Как писал Ceres
Такс, вот еще один пример:
h**p://www.inosmi.ru/
h**p://www.inosmi.ru/text/

Так это ж один домен

Какой из вышеперечисленных способ наиболее грамотный и правильный?

Закрыть домен от индексации (роботсом). Не претендую на жуткую грамотность, за то это самый простой способ. :)

Удачи.

Бородин Антон. 411-22-05, icq 199228260, bomass [at] ya.ru Домен .ru за 6,3$ (http://webst.ru/?id=146)
C
На сайте с 19.09.2001
Offline
120
#8

AiK, спасибо за замечания.

Ceres, если сайт на поддомене отличается дизайном, то лучше просто запретить его индексировать, без использования директивы Host

Ceres
На сайте с 28.09.2004
Offline
389
#9

В общем мы сделали вот так - robots.txt на поддомене

User-agent: Yandex

Disallow:

Host: www.site.ru

User-agent: *

Disallow:

SS
На сайте с 02.11.2004
Offline
3
#10

у меня два домена они являются полными зеркалами так как припаркованы к одной и той же папке

site1.ru и site2.ru

вот что именно я должен прописать в robots.txt чтобы для всех роботов основным сайтом являлся site1.ru

а то в некоторых поисковиках проиндексирован второй, а в некоторых первый :-(

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий