вопрос про robots.txt

A
На сайте с 04.02.2003
Offline
3
api
5801

Если я хочу запретить паукам ramblera индексировать мой сайт,

как правильнее будет составить robots.txt:

1)

User-agent: StackRambler/2.0

Disallow: /

или будет достаточно

User-agent: StackRambler

Disallow: /

т.е писать полное имя робота или можно ограничиться

названием без версии?

wolf
На сайте с 13.03.2001
Offline
1183
#1

Второй вариант. См. http://www.rambler.ru/doc/robots.shtml

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
N
На сайте с 21.11.2001
Offline
152
#2

А всех роботов Яндекса можно описать только так:

User-agent: yandex

или надо всех описывать отдельно I, D, M и т.д. и т.п.?

А несколько роботов в одной строке User-Agent как писать, через запятую или через пробел? 🙄

Понятно, что вопросы чайниковские, но как-то нет нигде однозначных ответов. Хочется до конца систематизировать.

И еще. Директиву Host как правильно указывать. После каждого User-Agent`a или в конце всего файла достаточно?

wolf
На сайте с 13.03.2001
Offline
1183
#3
А всех роботов Яндекса можно описать только так:
User-agent: yandex

Да. Только, к примеру, роботу с литерой D директивы robots.txt по барабану. Яндексоиды не всех своих роботов за роботов считают. Поэтому некоторые из них robots.txt игнорируют.

C
На сайте с 19.09.2001
Offline
120
#4
А несколько роботов в одной строке User-Agent как писать, через запятую или через пробел?

AFAIK, нельзя так делать. Либо только одного, либо всех сразу (User-agent: *).

Можно на нескольких сразу делать так:

User-agent: StackRambler

User-agent: Yandex

Disallow: /

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
N
На сайте с 21.11.2001
Offline
152
#5
Как писал Cherny
...Можно на нескольких сразу делать так:
User-agent: StackRambler
User-agent: Yandex
Disallow: /

Уважаемый, ИМХО, так вообще делать нельзя.

Как писал Яндекс
...Строка с полем User-Agent... должна предшествовать строкам с полем Disallow...

Мне кажется, что в Вашем случае строка для робота StackRambler проигнорируется.

А насчет того, можно или нельзя вместе, здесь четкий ответ - можно.

Стандарт исключений для роботов
...если в записи указано более одного имени робота, то права доступа распространяются для всех указанных имен...

Вот только не указано, как писать имена, если их более одного.

C
На сайте с 19.09.2001
Offline
120
#6
Уважаемый, ИМХО, так вообще делать нельзя.

Давайте разбираться ;)

Каждая строка представляет собой следующее:

<field>:<optionalspace><value><optionalspace>

ИМХО, <value> не может быть перечислением, так как возникнут неоднозначности с трактовкой имени робота.

The record starts with one or more User-agent lines, followed by one or more Disallow lines

А запись от записи отделяется пробелами:

The file consists of one or more records separated by one or more blank lines (terminated by CR,CR/NL, or NL).

Отсюда делаем вывод: следует писать несколько строк с User-agent, одна строка для одного робота.

Использовался следующий стандарт.

C
На сайте с 19.09.2001
Offline
120
#7
Только, к примеру, роботу с литерой D директивы robots.txt по барабану.

Как и для М. Разработчики руководствуются тем, что эти два зверя запускаются непосредственно пользователем.

N
На сайте с 21.11.2001
Offline
152
#8
Как писал Cherny
...ИМХО, <value> не может быть перечислением, так как возникнут...

На Ваше ИМХО, у меня есть свое ИМХО :). Любой программер скажет, что параметр value может быть перечисленным. Вопрос в том, что является разделителем.

Вообщем же я принимаю Ваши доводы, но резюмирую, что по обоим вопросам нет однозначного ответа. И Ваши, и мои источники информации авторитетны, и имеют принципиальные расхождения. Нужен тритейский судья. Ждем. 🚬

C
На сайте с 19.09.2001
Offline
120
#9
Вообщем же я принимаю Ваши доводы, но резюмирую, что по обоим вопросам нет однозначного ответа. И Ваши, и мои источники информации авторитетны, и имеют принципиальные расхождения.

Нет тут никаких расхождений, это один и тот же документ на разных языках :) Расхождения только в трактовке.

Запись должна начинаться с одной или нескольких строк User-Agent

Подождем Артема (aka AiK), он нас и разнимет.

NL
На сайте с 29.01.2003
Offline
212
#10

В справке Яндекса рекомендуют статью на CITForum посвященную robots.txt.

Там вначале написано, что:

Файл должен содержать одну или несколько записей (records), разделенных одной или несколькими пустыми строками ...
Любая запись (record) должна состоять хотя бы из одной строки (line) User-Agent и одной - Disallow

А потом:

Примечания переводчика
В настоящее время стандарт несколько изменился, например, можно записывать в строке User-Agent несколько имен роботов, разделенных пробелами или табуляторами.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий