Как Google индексирует спецсимволы HTML?

V
На сайте с 21.06.2007
Offline
124
504

Добрый день, есть сайт на чешском и французском, как вы знаете в данных языках есть множество разных ударений аксанов, грависов, апострофов и диакритических знаков. Порой, практически всегда)) редакторы каким-то образом прописывают их в виде спецсимволов, скорее есть проблема при копировании или в редакторе админки. На выходе в Html коде текст может отображаться вот так, с примесью спецсимволов

 

<p>Filip připomněl, že novin&aacute;ře ve veřejnopr&aacute;vn&iacute;ch m&eacute;di&iacute;ch, tedy v <a href="https://cz.sputniknews.com/tags/organization_Ceska_televize/" target="_blank" rel="noopener tag">Česk&eacute; televizi</a> a v Česk&eacute;m rozhlase, plat&iacute; občan&eacute; z&nbsp;koncesion&aacute;řsk&yacute;ch poplatků. Proto pr&aacute;vě oni by měli zveřejňovat sv&aacute; majetkov&aacute; přizn&aacute;n&iacute; už nyn&iacute;, podobně jak to dnes čin&iacute; poslanci nebo starostov&eacute;. Detaily n&aacute;vrhu zat&iacute;m je&scaron;tě nem&aacute;.</p>
<p class="">Podle iHNED.cz se tento n&aacute;vrh zat&iacute;m s&nbsp;podporou ve Sněmovně nesetkal. Pouze Josef H&aacute;jek z&nbsp;ANO odm&iacute;tl Filipovu iniciativu podpořit nebo odm&iacute;tnout, dokud nez&iacute;sk&aacute; v&iacute;ce informac&iacute;. Pir&aacute;tsk&yacute; poslanec Tom&aacute;&scaron; Mart&iacute;nek volbu novin&aacute;řů označil za nesmysl, ale připomněl, že jeho strana podala n&aacute;vrh na roz&scaron;&iacute;řen&iacute; kompetenc&iacute; Nejvy&scaron;&scaron;&iacute;ho kontroln&iacute;ho &uacute;řadu (NK&Uacute;) na kompletn&iacute; hospodařen&iacute; veřejnopr&aacute;vn&iacute;ch m&eacute;di&iacute;.</p>

Конкретно, так отображается в коде одно слово, должно быть так: veřejnoprávních

veřejnopr&aacute;vn&iacute;ch

Вопрос: Как к этому относится Google ? Усложняется ли процесс индексирования? Может ли сайт пессимизироваться по данной причине.

Компания по устройству буронабивных свай (https://drilling-msk.ru/)
богоносец
На сайте с 30.01.2007
Offline
754
#1

А вы эти слова и символы можете поискать... и убедиться. Иероглифы ещё бывают.

ВеликА тайна:

Индексируются не слова/буквы / алфавиты/языки,

а наборы символов. Это почти бесконтрольный процесс... Создатели сами полностью не знают чего умеет ихнее детище.

То, что редакторы генерят в html-коде html-сущности, не важно, лишь бы браузер показывал нормально.

V
На сайте с 21.06.2007
Offline
124
#2
богоносец:
А вы эти слова и символы можете поискать... и убедиться. Иероглифы ещё бывают.

ВеликА тайна:
Индексируются не слова/буквы / алфавиты/языки,
а наборы символов. Это почти бесконтрольный процесс... Создатели сами полностью не знают чего умеет ихнее детище.

То, что редакторы генерят в html-коде html-сущности, не важно, лишь бы браузер показывал нормально.

Я понимаю о чем вы, да браузер отображает это в нормальном виде, да при поиске в гугл по спецсимволам сайт не выйдет, он выйдет по тексту, но сейчас сайт низко пал)) пытаемся довести все до идеального состояния, вот тут такое....

Мы заглянули к конкурентам, у них такого нет и ранжируются к примеру лучше.

Если смотреть на код с иероглифами их как раз спецсимволами не закрывают (см. скриншот)

png Снимок экрана 2019-06-05 в 10.11.26.png
V
На сайте с 21.06.2007
Offline
124
#3

А вот здесь ужас со словами

png Снимок экрана 2019-06-05 в 10.15.07.png
FM
На сайте с 02.09.2015
Offline
45
#4
Vitiai:
А вот здесь ужас со словами

Как проверяете? Часто сталкиваюсь с тем, что не установлена локаль нужная, и все отображается вот таким вот "ужасом".

P.s. Чтобы гугл понимал наверняка символы, специфичные для языка, всегда нужно указывать hreflang

WR
На сайте с 27.04.2016
Offline
56
#5

Некоторые хостинги не читают в том числе и кириллицу в своем редакторе по умолчанию, хотя в браузере все ок

сайты на OVH
V
На сайте с 21.06.2007
Offline
124
#6
freezy_mind:
Как проверяете? Часто сталкиваюсь с тем, что не установлена локаль нужная, и все отображается вот таким вот "ужасом".

P.s. Чтобы гугл понимал наверняка символы, специфичные для языка, всегда нужно указывать hreflang

Проверяем очень просто : правая кнопка в браузере "посмотреть код страницы"

FM
На сайте с 02.09.2015
Offline
45
#7
Vitiai:
Проверяем очень просто : правая кнопка в браузере "посмотреть код страницы"

Значит локали. Попробуйте поставить нужные локали и посмотреть

богоносец
На сайте с 30.01.2007
Offline
754
#8
Vitiai:
Если смотреть на код с иероглифами их как раз спецсимволами не закрывают

Не спецсимволами, а html-сущностями.

Кодировку utf-8 сделайте, и в коде можно любые символы обычным текстом. Но старые редакторы этого не знают.

---------- Добавлено 05.06.2019 в 15:03 ----------

freezy_mind:
P.s. Чтобы гугл понимал наверняка символы, специфичные для языка, всегда нужно указывать hreflang

Боты понимать/знать не могут. Не обязателен этот атрибут. И языки боту знать не приходится...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий