Robots.txt или content ="noindex"

60

Redgektor

17 ноября 2017, 06:47

2266

Что я сам начинаю путаться что лучше закрыть страницы в robots.txt или установить на них <meta name="robots" content="noindex,nofollow">...

В чем принципиальная разница между этими инструментами?

Как я понимаю, закрытие в robots.txt рекомендует роботу вообще не посещать выбранные страницы, что позволяет экономить краулинговый бюджет.

Применяется для технических страниц CMS

Говорит что данную страницу не надо индексировать, но можно переходить по ссылкам на ней. Важно, что перед эти страницы поисковик сначала сканирует, т.е. краулинговый бюджет расходуется.

Может применяться для страниц пагинации каталога, страниц с нежелательными к индексированию get параметрами и т.д.

В чем еще разница? Есть какие либо принципиальные отличия в применении?

1784

LEOnidUKG

17 ноября 2017, 08:30

#1

robots.txt это говорит сразу же вообще туда не заходить и не смотреть, что за страница. Даже если она уже в индексе, она будет висеть после запрета.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/

Как навсегда удалить страницы Как закрыть от индесации Гугл игнорирует роботс

K

89

Kasperaitus

17 ноября 2017, 09:39

#2

Есть мнение, что <meta name="robots" content="noindex,nofollow"> надежнее, т.к. на robots.txt бот пс может иногда и подзабить.

1784

LEOnidUKG

17 ноября 2017, 09:48

#3

а robots.txt бот пс может иногда и подзабить.

Он может подзабить на всё.

1

98

Onecontent

17 ноября 2017, 11:07

#4

LEOnidUKG:
Он может подзабить на всё.

Поддерживаю.. И первый и второй вариант - рекомендательные директивы.

SEO\GEO медицинских клиник.

E1

71

Elvis123

17 ноября 2017, 12:15

#5

Есть мнение что это все не работает . Сам видел ссылки которые вроде бы ноуфолоу и ноуиндекс . Однако прога их распознавала как доуфолоу и вес они передавали и ТИЦ и т д

Кто мне ставит "-" можете запаять свою злость в целлофан и убрать ее на Колымский курок)) Про Курок нагуглите)

271

WebAlt

17 ноября 2017, 17:58

#6

https://support.google.com/webmasters/answer/6062608?hl=ru&ref_topic=6061961&visit_id=1-636465381403988530-2847334096&rd=1

Для чего нужен файл robots.txt?
Неграфические файлы
В случае с неграфическими файлами (например, веб-страницами) файл robots.txt используется для управления сканированием. Например, можно запретить сканирование похожих или ненужных страниц, чтобы не перегружать сервер. Нельзя использовать файл robots.txt, чтобы скрыть страницу из результатов Google Поиска. На нее могут ссылаться другие страницы, и она все равно будет проиндексирована. Чтобы заблокировать страницу в результатах поиска, применяйте тег noindex или директиву или установите пароль.

https://support.google.com/webmasters/answer/93710?hl=ru

Внимание! Поисковый робот не обнаружит атрибут noindex, если страница заблокирована в файле robots.txt. Такая страница может быть представлена в результатах поиска (например, если на нее есть ссылка на другой странице).

2

Все что нужно знать о DDоS-атаках грамотному менеджеру

Дзен реализовал для авторов возможность вывода денег через СПБ