Запрет в robots.txt

12
Александр
На сайте с 17.07.2009
Offline
371
1379

Коллеги, помогите разобраться с правилами в robots.txt

Вопрос в следующем. На сайте есть статьи (site.ru/article1), у статьи есть комменты и возможность на комменты отвечать (ссылка для ответа на коммент). Соответственно при переходе по ссылке получается вот такой урл: site.ru/comment/article1/reply (в коде имеется ссылка на каноническую страницу site.ru/article1)

Коллеги, нужно ли в robots.txt прописывать запрещающее правило для comment/* или директивы canonical = "site.ru/article1" достаточно?

Благодарю за ответы.

Сайты на WordPress тут просто летают! (https://vk.cc/atAGUU)
18ans
На сайте с 30.08.2017
Offline
44
#1

Достаточно.

Александр
На сайте с 17.07.2009
Offline
371
#2
18ans:
Достаточно.

а на краулерный бюджет это не повлияет?

18ans
На сайте с 30.08.2017
Offline
44
#3

Вот тут честно затрудняюсь ответить, но встрясочка должна быть... у меня так было когда каноничность подключал

---------- Добавлено 21.10.2018 в 19:03 ----------

Как по мне, лучше в теге прописать для них фолоу,ноиндекс вместо каноничности

Александр
На сайте с 17.07.2009
Offline
371
#4
18ans:
Как по мне, лучше в теге прописать для них фолоу,ноиндекс вместо каноничности

А какой смысл гонять бота по ноиндекс страницам? Кому от этого польза?

богоносец
На сайте с 30.01.2007
Offline
753
#5

Смысл/польза в обосновании костыля rel=canonical

aleksandrbol:
а на краулерный бюджет это не повлияет?

Скорее на его бессмысленное расходование.

Александр
На сайте с 17.07.2009
Offline
371
#6
богоносец:
Смысл/польза в обосновании костыля rel=canonical

Скорее на его бессмысленное расходование.

значит нужно банить в robots.txt?

JuniorVov
На сайте с 20.06.2017
Offline
69
#7
aleksandrbol:
значит нужно банить в robots.txt?

Самый простой вариант решения вопроса, но в таком случае со страниц site.ru/comment/article1/reply убрать каноникал на /article1/, а то плучиться что говорим ПС не индексируй но раз уж пришол каноническая страница здесь и в таком случае деректива роботс может быть проигнорирована.

А для экономии краулингового бюджета, к ссылкам такого плана можно добавлять символ "#" что бы получилось site.ru/comment/article1/#reply тогда робот ПС-а не пойдет на неё вобще и можно не использовать ни роботс ни каноникал.

Александр
На сайте с 17.07.2009
Offline
371
#8
JuniorVov:
Самый простой вариант решения вопроса, но в таком случае со страниц site.ru/comment/article1/reply убрать каноникал на /article1/, а то плучиться что говорим ПС не индексируй но раз уж пришол каноническая страница здесь и в таком случае деректива роботс может быть проигнорирована.

Если бота забанить в robots.txt, то как он проберётся на страницу site.ru/comment/article1/reply ? Возможно я вас неверно понял.

JuniorVov:
А для экономии краулингового бюджета, к ссылкам такого плана можно добавлять символ "#" что бы получилось site.ru/comment/article1/#reply тогда робот ПС-а не пойдет на неё вобще и можно не использовать ни роботс ни каноникал.

У меня CMS, там чтобы это изменить нужно лезти в ядро, а этого делать не желательно. Тогда намного проще AJAXом подгружать формы комментов.

JuniorVov
На сайте с 20.06.2017
Offline
69
#9
aleksandrbol:
Если бота забанить в robots.txt, то как он проберётся на страницу site.ru/comment/article1/reply ? Возможно я вас неверно понял.

Правильно, ведь роботс это не закон а рекомендация, тем более краулер гуляет по ссылкам в том числе и нофоллов, если есть ссылка на site.ru/comment/article1/reply он прийдет туда вспомнит что в роботсе ему говорили не индексируй и на этом его путешествие на этой странице закончиться, но если он увидет там каноникал то начнет сомневаться, мол если её не нужно индексировать то почему здесь важная для меня информация в виде каноникал.

---------- Добавлено 22.10.2018 в 10:07 ----------

aleksandrbol:
У меня CMS, там чтобы это изменить нужно лезти в ядро, а этого делать не желательно. Тогда намного проще AJAXом подгружать формы комментов.

С AJAXом бы не спешил, там у гугла какие то заморчки начались, сильно не вникал так как не использую.

Александр
На сайте с 17.07.2009
Offline
371
#10
JuniorVov:
Правильно, ведь роботс это не закон а рекомендация, тем более краулер гуляет по ссылкам в том числе и нофоллов, если есть ссылка на site.ru/comment/article1/reply он прийдет туда вспомнит что в роботсе ему говорили не индексируй и на этом его путешествие на этой странице закончиться, но если он увидет там каноникал то начнет сомневаться, мол если её не нужно индексировать то почему здесь важная для меня информация в виде каноникал.

В данный момент у меня помимо каноникла там ещё и <meta name="robots" content="noindex, follow" /> Думаю боту должно быть понятно, или я опять чего-то не понимаю?

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий