один robots.txt на несколько доменов

AG
На сайте с 10.09.2004
Offline
31
1921

на один аккаунт настроено несколько доменов, примерно такие:

domen1.ru

link.domen1.ru

map.domen1.ru

domen2.ru

работают и используются как domen1.ru, так и www.domen1.ru. так же и для domen2 (с www и без)

Вопрос заключается в следующем:

как правильно прописать в robots.txt чтобы не индексировался домен второго уровня domen2.ru (нужно учитывать как с www, так и без него)

читал про директиву Host на

http://www.yandex.ru/info/webmaster2.html

но я так понимаю что она не страндартная и непонятно как будет воприниматся другими поисковиками.

так же домен domen1.ru и его поддомены поиндексированы и не хотелось по ошибке их выкинуть из поисковиков.

мне видится такой robots.txt

поправьте, если что не так, те кто имел с этим дело на практике.


User-Agent: *
Disallow:
Host: domen1.ru
Host: www.domen1.ru
Host: link.domen1.ru
Host: map.domen1.ru

Повторяю, что спрашиваю потому, что слишком дорого экспериментировать!

Спасибо.

programming for food (;)
ER
На сайте с 19.11.2002
Offline
107
#1

Неверно. Директива Host должна быть только одна, потому как возможно только одно главное зеркало. Я из вопроса не понял, что Вы хотите сделать: указать Яндексу главное зеркало или запретить индексацию второго домена. Если нужно именно запретить, то в том же документе Яндекса, на которы вы привели ссылку, один способ решения проблемы описан:

Если у вас сервер Apache, то можно вместо использования директивы Host задать robots.txt с использованием директив SSI:

<!--#if expr=" \"${HTTP_HOST}\" != \"www.главное_имя.ru\" " -->
User-Agent: *
Disallow: /
<!--#endif -->

В этом файле роботу запрещен обход всех хостов, кроме

www.главное_имя.ru.
Как включать SSI, можно прочесть в документации по вашему серверу или обратиться к вашему системному администратору. Проверить результат можно, просто запросив страницы:

http://www.главное_имя.ru/robots.txt
http://www.другое_имя.ru/robots.txt
и т.д. Результаты должны быть разные.

А если хотите указать главное зеркало, то просто укажите его:


User-Agent: *
...
Host: www.domen1.ru

А для доменов третьего уровня отдельный robots.txt писать нужно.

AN
На сайте с 05.06.2004
Offline
243
#2

На каждый домен нужен свой robots.txt, который должен быть виден так:

http://domen1.ru/robots.txt

http://link.domen1.ru/robots.txt

http://map.domen1.ru/robots.txt

http://domen2.ru/robots.txt

При этом

как правильно прописать в robots.txt чтобы не индексировался домен второго уровня domen2.ru

в http://domen2.ru/robots.txt написать:

Host: domen2.ru

User-Agent: *

Disallow: /

Размещу ваши баннеры на посещаемых сайтах. Места еще есть! Возможен безнал. (/ru/forum/324945) Нужны копирайтеры/рерайтеры - медики. Пишите в личку. (/ru/forum/676932)
C
На сайте с 19.09.2001
Offline
120
#3
А для доменов третьего уровня отдельный robots.txt писать нужно.

В данном случае не нужно, а в общем для доменов третьего уровня robots.txt пишется точно так же, как и для доменов второго. Вот на поддомене forum на этом сайте robots.txt нету, так Яндекс успешно проиндексировал весь мусор, вроде printthread.php, misc.php, member.php, etc., которые на основном домене запрещены и не индексируются.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
AG
На сайте с 10.09.2004
Offline
31
#4

это не зеркала, это скорее сайты-спутники.

мне понятно, что можно сделать отдельный robots.txt для каждого домена/поддомена, это был бы самый простой вариант, если бы домены были настроены на разные аккаунты (директории), а они все на одном сидят (так надо ;))

попробую сделать путем изпользования директив SSI как EvgRen предложил.

то, что писать несколько хостов нельзя - плохо ;(

спасибо, о результате экспериментов сообщу.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий