Директива Host

123
kimberlit
На сайте с 13.03.2007
Offline
370
#11
T.R.O.N:
По стандарту, файл роботс.тхт обрабатывается последоватльно. Директива HOST ставится всегда последней. Посему, те кто ее не понимаю, встретив ее, прекратят обработку файла, но, как понятно, это уже значение не играет.

Т.е. вы считаете, что в этой ситуации:

User-agent: Yandex
Disallow:
Host: site.ru

User-agent: *
Disallow:

любой робот, отличный от Yandex, дойдёт до Host и прекратит чтение файла robots.txt? И как он вообще дойдёт до неё, если user-agent не его?

Или вы имели в виду такой вариант:

User-agent: *
Disallow:
Host: site.ru

Во втором случае согласен, что робот (не Y) глюканёт и скажет: good bye ...

W
На сайте с 13.10.2007
Offline
83
#12

Новые правила от 21 числа

новость здесь - http://webmaster.ya.ru/?ncrnd=3892

Использование robots.txt - http://help.yandex.ru/webmaster/?id=996567

aTrends.ru - сервис по анализу качества рекламы и конкурентов в Яндекс.Директ (http://atrends.ru)
mikuny
На сайте с 13.12.2007
Offline
45
#13

vinic

Все правильно у вас написано, такая конструкция работает на ура;)

Бизнес начинается с регистрации Большой процент с продажи с продажи (http://www.goldstimul.com/affiliates/signup.php?a_aid=4dda60bca9363)
Megavolt
На сайте с 23.12.2005
Offline
179
#14
upyrj:
Или ты про невалидность для не-Яндекса?

ну да :) яндекс то слопает без проблем

кстати, пробегала тут инфа (самому лень проверять), что надо писать User-Agent:

вроде как у человека решились проблемы, после того как слово agent исправили с большой буквы.

и делайте отдельную секцию для яндекса, хуже от этого точно не будет.

Иногда лучше жевать.... (С)
Dweep
На сайте с 11.12.2006
Offline
207
#15

Извиняюсь за немного оф, а для гугла тогда как писать?

User-Agent: Yandex
Disallow:
Host: site.ru

User-agent: *
Disallow:
MANiac
На сайте с 14.06.2005
Offline
98
#16
Megavolt:
ну да :) яндекс то слопает без проблем

У меня всю жизнь и Гугл хавает нормально )

Юзер агент: *

Хост - в конце файла. Все чики пики ;)

www.b2seo.net (www.b2seo.net)-свободные домены с тиц и пр, история пузомерок свободные домены с тИЦ (/ru/forum/751858) - от $0,9 за тысячи свободных доменов с тИЦ, PR, в индексе, Я.тема, Dmoz
Каширин
На сайте с 03.01.2004
Offline
1018
#17
londonetz:
Сегодня проверял яндексовским скриптом robots.txt на одном из сайтов - директиву Host игнорирует! Указывал "User-agent: *" и "User-agent: Yandex" - по барабану, видит только что в Disallow...

Две недели назад всё было нормально. Нововведение или глюк?

Файл robots.txt - это стандарт, в котором важны каждая буква или символ. Да, многие дополняют этот стандарт, но его никто не отменял.

Правильно писать - User-Agent! Agent нужно писать с большой буквы. Если вы пишете с маленькой - хоть запишитесь, все будут игнорировать.

kimberlit
На сайте с 13.03.2007
Offline
370
#18
MANiac:
У меня всю жизнь и Гугл хавает нормально )
Юзер агент: *
Хост - в конце файла. Все чики пики

У вас Google понимает Host ??? Поздравляю, однако )))

T.R.O.N
На сайте с 18.05.2004
Offline
314
#19
kimberlit:
Во втором случае согласен, что робот (не Y) глюканёт и скажет: good bye ...

не глюканет, а исполнит все инструкции, которые для него валидны!

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
MANiac
На сайте с 14.06.2005
Offline
98
#20

kimberlit, Гугл не воспринимает как ошибку в конце строки. Вникай в суть. Я не говорил что гугл понимает хост и прекрасно знаю что хост - изобретение Я. Я проконстатировал факт. А вы, я смотрю, не можете не воспользоваться моментом...

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий