Мультиязычность, 301 редиректы и hreflang

N4
На сайте с 07.03.2022
Offline
0
220

Здравствуйте! При аудите сайта заметил, что количество 404-х страниц на сайте растет https://prnt.sc/6aJAfXMPHKhN Начал копать, обнаружил проблемы:

- В атрибутах hreflang была ошибка в урлах. Пример: https://example.com/blogpage1. Если урл написать так  https://example.com/blog/page1/ или  https://example.com/blog/page1 (есть редирект с адресов без / в конце на урл с / в конце), то код ответа будет 200, а не 404. В общем, проблему исправили с слитным написанием.

- Языковые страницы не содержали самореферентный canonical, то есть в коде таких страниц не было ссылки на саму себя. Это тоже исправили.

Что можно сказать про мультиязычность на сайте: 

Для каждой продуктовой страницы есть переводы на все 9 доступных на сайте языков. А вот некоторые публикации блоговые могут быть без перевода на какой-нибудь язык. Это значит, что пользователь, к примеру, из арабских эмиратов, не увидит в выдаче публикацию, которая переведена только на английский или русский.

Вопрос: можно ли сделать так, чтобы он смог увидеть англоязычную страницу в выдаче?

Во всех страницах, для которых нет перевода, содержится следующее (что касается hreflang):  

  • <link rel="alternate" hreflang="x-default" (по-умолчанию для всех страниц x-default - англоязычная страница)
  • <link rel="alternate" hreflang="en" также со ссылкой на англоязычную страницу
  • <link rel="alternate" hreflang="" href="https://nsysgroup.com//blog/page1/" /> здесь и hreflang не заполнен и два слеша перед blog

То есть если для страницы нет перевода - она является 404й и содержит в коде выше перечисленное.

GSC и яндекс вебмастер продолжают "радовать" увеличивающимся числом 404-х.  Я использовал краулер SiteAnalyzer, который показал ошибки с hreflang https://prnt.sc/81BIh54C9Qmt Из официальной документации краулера: В данном разделе указаны все страницы, у которых ссылки в элементах hreflang ведут на страницы 404. 

Еще один нюанс: если человек из Испании нашел в выдаче нашу страницу (она будет на испанском, т.к hreflang указан), перешел по ней и на сайте выбрал определенный язык  (например английский), то в дальнейшем при попытке перехода по страницам из выдачи будет будет происходить редирект на страницы с переводом на выбранный язык. И так будет до тех пор, пока он не сменит язык на испанский. 

Вопрос: что предпринять для уменьшения количества 404-х страниц? Вебмастер и GSC продолжают показывать как 404-е со слитным написанием родительской категории (blog) и его дочерних страниц в урле (повторю пример: https://example.com/blogpage1), так и просто страницы без перевода.

P.S. В исследовании https://www.searchenginejournal.com/75-multilingual-websites-hreflang-implementation-mistakes/185737/#close говорится про проблему когда ссылка hreflang указывает на перенаправленную страницу. Цитата: "Если ваша ссылка hreflang указывает на перенаправленную веб-страницу, новая страница может не проиндексироваться или даже не появиться в результатах поиска.". Интересно ваше мнение на этот счет.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий