Robots.txt или content ="noindex"

R
На сайте с 04.12.2016
Offline
60
2214

Что я сам начинаю путаться что лучше закрыть страницы в robots.txt или установить на них <meta name="robots" content="noindex,nofollow">...

В чем принципиальная разница между этими инструментами?

Как я понимаю, закрытие в robots.txt рекомендует роботу вообще не посещать выбранные страницы, что позволяет экономить краулинговый бюджет.

Применяется для технических страниц CMS

<meta name="robots" content="noindex,follow">

Говорит что данную страницу не надо индексировать, но можно переходить по ссылкам на ней. Важно, что перед эти страницы поисковик сначала сканирует, т.е. краулинговый бюджет расходуется.

Может применяться для страниц пагинации каталога, страниц с нежелательными к индексированию get параметрами и т.д.

<meta name="robots" content="noindex,nofollow"> - аналогично, но переходить по ссылкам не рекомендуется.

В чем еще разница? Есть какие либо принципиальные отличия в применении?

LEOnidUKG
На сайте с 25.11.2006
Offline
1762
#1

<meta name="robots" content="noindex,nofollow"> - ставиться точечно или когда нужно убрать страницу из индекса ПС.

robots.txt это говорит сразу же вообще туда не заходить и не смотреть, что за страница. Даже если она уже в индексе, она будет висеть после запрета.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/
K
На сайте с 08.04.2010
Offline
89
#2

Есть мнение, что <meta name="robots" content="noindex,nofollow"> надежнее, т.к. на robots.txt бот пс может иногда и подзабить.

LEOnidUKG
На сайте с 25.11.2006
Offline
1762
#3
а robots.txt бот пс может иногда и подзабить.

Он может подзабить на всё.

Onecontent
На сайте с 02.05.2016
Offline
92
#4
LEOnidUKG:
Он может подзабить на всё.

Поддерживаю.. И первый и второй вариант - рекомендательные директивы.

Создание и продвижение сайтов в Самаре ( https://onecontent.ru ) Автоаксессуары и тюнинг в Красноярске ( https://carbonado24.com )
E1
На сайте с 09.05.2017
Offline
71
#5

Есть мнение что это все не работает . Сам видел ссылки которые вроде бы ноуфолоу и ноуиндекс . Однако прога их распознавала как доуфолоу и вес они передавали и ТИЦ и т д

Кто мне ставит "-" можете запаять свою злость в целлофан и убрать ее на Колымский курок)) Про Курок нагуглите)
WebAlt
На сайте с 02.12.2007
Offline
260
#6

https://support.google.com/webmasters/answer/6062608?hl=ru&ref_topic=6061961&visit_id=1-636465381403988530-2847334096&rd=1

Для чего нужен файл robots.txt?
Неграфические файлы
В случае с неграфическими файлами (например, веб-страницами) файл robots.txt используется для управления сканированием. Например, можно запретить сканирование похожих или ненужных страниц, чтобы не перегружать сервер. Нельзя использовать файл robots.txt, чтобы скрыть страницу из результатов Google Поиска. На нее могут ссылаться другие страницы, и она все равно будет проиндексирована. Чтобы заблокировать страницу в результатах поиска, применяйте тег noindex или директиву или установите пароль.

https://support.google.com/webmasters/answer/93710?hl=ru

Внимание! Поисковый робот не обнаружит атрибут noindex, если страница заблокирована в файле robots.txt. Такая страница может быть представлена в результатах поиска (например, если на нее есть ссылка на другой странице).

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий