Вопрос по robots.txt

12
Y
На сайте с 03.02.2003
Offline
43
yax
2164

Правильно ли я понимаю, что конструкция типа:

----------

User-Agent: *

Host: www.myhost.ru

--------

в robots.txt запретит для индексации все страницы www.myhost.ru но НЕ ЗАПРЕТИТ все страницы http://myhost.ru

Дело вот в чем. Есть сайт, и так исторически сложилось(доменное имя длинное), что он проиндексирован и выдается в результатах без www. Все ссылки на него стоят тоже без www. При переиндексации Яндекс считает, что это 2 разных сайта, с разными "Кто ссылается", с разным ТИЦ. Я не против "склейки", но хочу, чтобы она была в пользу "без www", вот и думаю запретить его.

Главный вопрос: Конструкция robots.txt правильная???

ER
На сайте с 19.11.2002
Offline
107
#1

Вроде так. Только я бы в User-Agent указал yandex, ведь другим роботам этого знать не надо.

wolf
На сайте с 13.03.2001
Offline
1183
#2
Правильно ли я понимаю, что конструкция типа:
----------
User-Agent: *
Host: www.myhost.ru
--------

в robots.txt запретит для индексации все страницы www.myhost.ru но НЕ ЗАПРЕТИТ все страницы http://myhost.ru

Неправильно, так как в качестве параметра директивы host указывается имя основного зеркала.

В вашем случае должно быть:

User-Agent: *

Host: myhost.ru

См. http://www.yandex.ru/info/webmaster2.html#virtual

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
ER
На сайте с 19.11.2002
Offline
107
#3

Упс, поспешил, больше не буду. :)

Y
На сайте с 03.02.2003
Offline
43
yax
#4

Спасибо! Ээх, хорошо что вначале спросил... :)

ER
На сайте с 19.11.2002
Offline
107
#5

А ведь говорили же как только ввели Host, AiK кажется, непонятно что в туда писать надо, обычно запрещающее что-то после User-Agent идёт. Не послушал Яндекс человека...

Avatar
На сайте с 18.05.2003
Offline
168
#6

User-Agent: *

Host: www.myhost.ru будет значит то, что главный сайт www.myhost.ru, а myhost.ru - зеркало. Я об этом уже недавно спрашивал. Официальную поддержку из наших 3х SE официально только Яндекс указал, если не ошибаюсь

M
На сайте с 25.01.2001
Offline
57
#7

yax, небольшой опрос (:)):

1) Откуда Вы узнали о директиве host?

2) Почему Вы (ошибочно) решили составить файл robots.txt именно так, как в Вашем первоначальном постинге?

T
На сайте с 04.06.2003
Offline
3
#8

небольщой допрос 😂

Делай добро и бросай его в воду..
Avatar
На сайте с 18.05.2003
Offline
168
#9

Лично я о "хост" узнал с Яндекса. У Вас же там и лежит это. Кстати, я бы выложил один полноценный живой Роботс.тхт, а не описания фрагментов, а то поначалу не особо то поймешь, как их компилировать воедино правильно.

E
На сайте с 22.04.2002
Offline
13
#10

Yandex вообще реагирует на директиву host? Прописал месяц назад основной адрес в robots.txt. До сих пор в выдаче висит зеркало.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий