вопрос по robots.txt

D
На сайте с 23.07.2005
Offline
43
720

У меня на сайте есть несколько файлов уже проиндексированных яндексом, вида file*.html

если я впишу в robots.txt строку

User-agent: *

Disallow: /file*.html$

или правильнее так

User-agent: *

Disallow: file*.html$

то при следующей переиндексации яндекс уберет из своей базы эти файлы? и вообще правильна ли эта запись для яндекса?

Sonja
На сайте с 05.06.2003
Offline
170
#1

В стандарте файла robots.txt знак "*" используется только для указания на User-agent-ов. Запись после Disallow указывает на то, что все адреса сайта начинающиеся аналогичной записи не индексируются.

Например

User-agent: *

Disallow: /адрес

Всеми роботами не индексируются следующие урлы:

/адрес

/адресат

/адрес/1

Ссылки по теме:

http://webmaster.yandex.ru/faq.xml?id=502499#robotstxt

http://www.robotstxt.org/wc/exclusion-admin.html

С уважением, Ольга Лебедева
ali13
На сайте с 27.03.2006
Offline
68
#2
Deyn:
то при следующей переиндексации яндекс уберет из своей базы эти файлы?

лучше дать ему понять об этом здесь http://webmaster.yandex.ru/delurl.xml

Deyn:
и вообще правильна ли эта запись для яндекса?

яндекс тут ни причём, существует стандарты которые соблюдают все поисковики, а стандарт говорит о том, что в файле роботс.тхт регулярные выражения в адресах страниц не приемлимы и поэтому знаки * и $ это ошибка.

I don't know if it's what you want, but it's what you get
D
На сайте с 23.07.2005
Offline
43
#3

просто у меня были сомнения, т.к. специалисты netpromoter утверждают обратное - http://www.netpromoter.ru/metatag/help/robots_editor.html

хотя наверное они просто прохие специ...

Megavolt
На сайте с 23.12.2005
Offline
179
#4

все мы плохие спецы... в той или иной области...

Иногда лучше жевать.... (С)
D
На сайте с 23.07.2005
Offline
43
#5

интересно, для яндекса запись вида

Disallow: file.html

неправильная, а правильная

Disallow: /file.html

Alexey®
На сайте с 21.08.2005
Offline
139
#6

Разные поисковики имеют свои расширения стандарта robots.txt

GoogleBot поддерживает символы подстановки *

для директивы Disallow

Яндекс и Рамблер - нет.

Без символов подстановки легко обойтись, т.к. в директиве Disallow указывается префикс (начало) URLов, запрещаемых к индексации.

--
AiK
На сайте с 27.10.2000
Offline
257
AiK
#7

Deyn, решение твоей проблемы:


User-agent: *
Disallow: /file

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий