Правильно ли составлен роботс?

12
ВC
На сайте с 02.02.2006
Offline
463
866

Роботс на моем сайте имеет вот такой вид:

User-agent: *

Disallow: /fv21/

Disallow: /arhiv/

Host: site.ru

При этом я надеюсь, что заложил в него такой смысл:

- никаким поисковым системам не индексировать содержимое папки /fv21/ и содержимое папки /arhiv/;

- главным доменом считать site.ru, а все другие домены, где встретиться такое же содержание, (в частности www.site.ru), считать его зеркалами.

Правильно ли составлен роботс?

Kislov
На сайте с 29.04.2006
Offline
185
#1

Правильно будет

User-agent: *

Disallow: /fv21/

Disallow: /arhiv/

User-agent: Yandex

Disallow: /fv21/

Disallow: /arhiv/

Host: site.ru

Директива host предназначена для Яндекса. Другие роботы её игнорируют.

Sveta Prokopeva
На сайте с 10.05.2006
Offline
99
#2

Kislov, именно по этому вариант ТС так же правильный.

Всякую чушь роботы не подгоняют под известные инструкции, а просто не интерпретируют.

AN
На сайте с 05.06.2004
Offline
243
#3
Sveta Prokopeva:
Всякую чушь роботы не подгоняют под известные инструкции, а просто не интерпретируют.

... или игнорируют блок целиком ;)

Размещу ваши баннеры на посещаемых сайтах. Места еще есть! Возможен безнал. (/ru/forum/324945) Нужны копирайтеры/рерайтеры - медики. Пишите в личку. (/ru/forum/676932)
Talisman13
На сайте с 20.01.2007
Offline
211
#4

А так правильно:

User-agent: *

Disallow: /title.html

Disallow: /rek.html

User-agent: *

Disallow:

Host: http://site.ru/

C
На сайте с 31.05.2005
Offline
62
#5
Sveta Prokopeva:
Kislov, именно по этому вариант ТС так же правильный.
Всякую чушь роботы не подгоняют под известные инструкции, а просто не интерпретируют.

Поддерживаю.

От себя могу добавить, что для Гугля можно воспользоваться фишками для вебмастеров, там есть возможность указать основной сайт и зеркала.

Сначала я отъедаюсь тут (http://vkysno.kiev.ua), а потом худею здесь (http://10diet.net) :)
Flint
На сайте с 25.12.2002
Offline
98
#6
Kislov:
Правильно будет

User-agent: *
Disallow: /fv21/
Disallow: /arhiv/

User-agent: Yandex
Disallow: /fv21/
Disallow: /arhiv/
Host: site.ru

Директива host предназначена для Яндекса. Другие роботы её игнорируют.

Тогда уж лучше вот так:

User-agent: Yandex

Disallow: /fv21/

Disallow: /arhiv/

Host: site.ru

User-agent: *

Disallow: /fv21/

Disallow: /arhiv/

Лучше сначала конкретику...

С уважением, Копылов Кирилл | ICQ - 505-982 | Тел. +7 (8412) 25-22-00
Ayavryk
На сайте с 11.10.2003
Offline
209
#7
Тынгыр, мынгыр, комсомол (http://erum.ru). Ехари, ехари, (жалобно) аяврик. /народная тунгусская песня/
Talisman13
На сайте с 20.01.2007
Offline
211
#8
Flint:
Тогда уж лучше вот так:

User-agent: Yandex
Disallow: /fv21/
Disallow: /arhiv/
Host: site.ru

User-agent: *
Disallow: /fv21/
Disallow: /arhiv/

Лучше сначала конкретику...

То есть сначала конкретика? А потом для всех поисковых систем?

Kislov
На сайте с 29.04.2006
Offline
185
#9

Sveta Prokopeva, ознакомтесь со стандартами файла роботс.

Согласен что какой-то робом может проигнорировать директиву, а некоторые могут и блок проигнорировать. Лучше соблюдать правила.

Talisman13, не верно. Вы и запрещаете, и разрешаете индексировать одновременно. Смотрите мой пример выше.

vetal_ka
На сайте с 31.03.2007
Offline
9
#10
Kislov:
Смотрите мой пример выше

Хм.. как раз проверил по вашей схеме - чекер общий блок просит кинуть вниз:

WARNING: The block of code addressed to all spiders (User-agent: *) is not the last one. We advise you to move it at the bottom of the robots.txt file, to reduce interpretation problems with some old robots.

Я так понимаю что это нестрашно... Но так же ругается на команду Хост:

Host: site.ru

Unknown command. Acceptable commands are "User-agent" and "Disallow".

Вот тут не знаю почему... Составил робот первый раз. Может чего недопонял?

структура такая:

User-agent: *

Disallow:

User-agent: Yandex

Disallow:

Host: site.ru

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий