Google обновил справочный документ, посвящённый консолидации повторяющихся URL. Теперь он содержит информацию о том, как поисковая система расценивает различные виды каноникализации страниц.
Что особенно важно, теперь Google официально заявляет, что канонические страницы в файлах Sitemap считаются менее значимым сигналом для робота Googlebot, чем атрибут rel=canonical.

Далее в документе Google добавляет:
«Мы не гарантируем, что URL в файле Sitemap будут рассматриваться как канонические во всех случаях. Но в целом это удобный способ для определения приоритетных URL на крупном сайте. Не включайте в файл Sitemap неканонические страницы, если вы его используете».
Почему канонические страницы, указанные в файле Sitemap, – это более слабый сигнал для Google? Дженнифер Слэгг из TheSEMPost выделила следующие причины:
- Многие генераторы файлов Sitemap, используемые сайтами, по умолчанию включают в карту каждый URL на сайте, даже если отдельные страницы содержат атрибут rel=canonical.
- Некоторые вебмастера не обновляют файлы Sitemap так же часто, как свои сайты. Соответственно, в них могут содержаться устаревшие данные.
- Даже если файл Sitemap сделан правильно, роботу Googlebot тем не менее нужно будет определить повторяющуюся страницу для каждой канонической, которая будет в нём указана, а этот процесс не всегда проходит идеально.
Поэтому для каноникализации страниц в первую очередь рекомендуется использовать атрибут rel=canonical.
Статьи по теме: