Символ подстановки в robots.txt

Links Forever
На сайте с 20.08.2006
Offline
329
1633

Хочу закрыть для индексации все страницы для печати через robots.txt

Вся беда в том, что адреса у страниц сформированы через ЧПУ и имеют вид

/год/месяц/число/имяновости_print:

И таких вариантов урлов тысячи. Всех не перечислить, объединяет их только print:

Можно ли использовать в robots.txt символ подстановки, такое правило поймут роботы Яндекса и Гугла:

Disallow: /*print:

Или как его более правильно сформулировать?

Я очень люблю вкусные рецепты (https://povar24.info) квашеной капусты (https://kvashenaya-kapusta.ru/) и салат оливье (https://salatolive.ru/).
MZ
На сайте с 27.01.2007
Offline
88
#1

если возможно - поправьте в шаблоне страниц для печати мета-тэг...

<META name="ROBOTS" content="noindex,nofollow">

404 Not Found
orphelin
На сайте с 02.07.2006
Offline
261
#2

Использование спецсимволов "*" и "$".

При указании путей директив Allow-Disallow можно использовать спецсимволы '*' и '$', задавая, таким образом, определенные регулярные выражения. Спецсимвол '*' означает любую (в том числе пустую) последовательность символов. Примеры:

User-agent: Yandex

Disallow: /cgi-bin/*.aspx # запрещает '/cgi-bin/example.aspx' и '/cgi-bin/private/test.aspx'

Disallow: /*private # запрещает не только '/private', но и '/cgi-bin/private'

это что касается Яндекса

stifler_x
На сайте с 19.06.2008
Offline
193
#3
mrZer0:
Disallow: /*print:

У вас ДЛЕ? Такая конструкция у меня работает...

Проверьте здесь, на всякий случай...

Links Forever
На сайте с 20.08.2006
Offline
329
#4

А мета тег разве избавит от уже проиндексированных? Т.е. будут они потихоньку из индекса выходить?

Спасибо за подсказки

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий