Сотрудник Google Джон Мюллер рассказал в Reddit о различиях между сигналами noindex и rel=canonical и о том, почему они не должны смешиваться.
Говоря вкратце, Google нужны чёткие, последовательные и понятные сигналы. Когда на сайте сообщается, что один URL важнее другого, но при этом другой сигнал утверждает противоположное, или же используется noindex, чтобы скрыть менее важные страницы, но при этом передавать ссылочный вес другим страницам – то, в конечном итоге, Google может сделать не то, что нужно владельцу ресурса.
«Общее правило заключается в том, что сигналы перенаправляются и объединяются с каноникализацией. Когда Google видит два URL с одного сайта, которые выглядят одинаково, и вы чётко сообщаете о своих предпочтениях, то мы пытаемся объединить их и обрабатывать их как один (обычно более сильный) URL вместо отдельных двух. Редиректы, rel=canonical, внутренние и внешние ссылки, файлы Sitemap, heflang и т.п. показывают нам ваши предпочтения, и чем более согласованно вы их применяете, тем больше мы им следуем и используем их для выбора канонической версии страницы.
С другой стороны, noindex (один) и директива disallow в файле robots.txt не являются чёткими сигналами для каноникализации. Наличие на странице лишь тега noindex не говорит нам, что вы хотите объединить его с чём-то ещё и что сигналы должны быть перенаправлены. Директива disallow в файле robots.txt – ещё сложнее для понимания, мы не знаем, есть ли на сайте похожие страницы, поэтому мы не можем использовать этот сигнал для каноникализации.
Отсюда вытекает правило: вы не должны смешивать noindex и rel=canonical: для нас это очень противоречивые сигналы. Обычно мы учитываем rel=canonical и используем его как более важный сигнал, чем noindex. Но всякий раз, когда вы полагаетесь на интерпретацию со стороны компьютерного скрипта, вы уменьшаете вес вашего входа :) И SEO по большей части сводится к передаче компьютерным скриптам информации о ваших предпочтениях».
Напомним, что в феврале Google обновил справочный документ, посвящённый консолидации повторяющихся URL. Теперь он содержит информацию о том, как поисковая система расценивает различные виды каноникализации страниц.