Некорректная обработка конструкции <![CDATA[<noindex>]]>

12
DM
На сайте с 19.10.2007
Offline
20
2978

На сайте используется следующая конструкция:

<span style="display:none"><![CDATA[<noindex>]]></span>

Главная
<span style="display:none"><![CDATA[</noindex>]]></span>

Яндекс замечательно с этой конструкцией справляется. Однако гугл (равно как и SharePoint Search Server) показывают в выдаче следующее (в html):

]]&gt;Главная]]&gt;

В чем может заключаться проблема?

http://www.mwoa.ru (http://www.mwoa.ru) - Midgard's World of Art
dimmu-borgir
На сайте с 16.03.2009
Offline
170
#1
deMidgard:
На сайте используется следующая конструкция:
<span style="display:none"><![CDATA[<noindex>]]></span>

Главная
<span style="display:none"><![CDATA[</noindex>]]></span>


Яндекс замечательно с этой конструкцией справляется. Однако гугл (равно как и SharePoint Search Server) показывают в выдаче следующее (в html):
]]&gt;Главная]]&gt;


В чем может заключаться проблема?

Быть может вам это поможет-

noindex — имя не входящего в официальную спецификацию тега языка гипертекстовой разметки веб-страниц HTML, предназначенного для включения в него частей веб-страниц, не предлагаемых к индексации поисковыми системами.

Тег предложен российской компанией «Яндекс» в качестве альтернативы атрибуту nofollow и в настоящее время распознаётся российскими поисковыми системами Яндекс[1] и Рамблер[2].

DM
На сайте с 19.10.2007
Offline
20
#2

Я знаю про валидность тега noindex, для этого некоторые умы воспользовались методом оборачивания тега в CDATA. Весь текст внутри CDATA вроде бы должен восприниматься как текст, однако этого не происходит, точнее это происходит в случае с Яндексом.

Гугл (как и SharePoint) где-то ломается, в результате чего в выдаче обоих систем могут появиться совершенно нерелевантные запросу страницы.

Хотелось бы разобраться, почему Гугл воспринимает эту конструкцию с ошибкой.

Василий Ткачев
На сайте с 19.05.2005
Offline
481
#3

я бы вообще не советовал юзать ноуиндекс

Продвигаем естественно ( http://www.inetessentials.ru/ ) и непринужденно. Практический курс по оптимизации ( https://allintop.ru/optimization/ ) - без воды и на основе сайтов студентов. Ежегодная конференция All in Top Conf (https://www.allintopconf.ru/)
dimmu-borgir
На сайте с 16.03.2009
Offline
170
#4
inetessentials:
я бы вообще не советовал юзать ноуиндекс

В чем причина?

S
На сайте с 27.01.2010
Offline
12
#5

А какой у Вас doctype - xhtml? Проверьте

Василий Ткачев
На сайте с 19.05.2005
Offline
481
#6
dimmu-borgir:
В чем причина?

если вы вдумаетесь в чем причина, поймете...

ну или поставите эксперименты, например...

богоносец
На сайте с 30.01.2007
Offline
774
#7
deMidgard:
В чем может заключаться проблема?

В том, что ПС не спешат в этом всём разбираться, у них просто нет заинтересованности.

deMidgard:
про валидность тега noindex, для этого некоторые умы воспользовались методом оборачивания тега в CDATA.

И чего получается? + вариант валидации, а функция noindex выполняется.

На сайте используется следующая конструкция:
<span style="display:none"><![CDATA[<noindex>]]></span>

Главная
<span style="display:none"><![CDATA[</noindex>]]></span>

Яндекс замечательно с этой конструкцией справляется.

И действительно не ищет слово =Главная= при ограничении по урлу? Если да, то хочу пример в ЛС.

Что мешает это сделать скриптом?

L
На сайте с 07.12.2007
Offline
351
#8
dimmu-borgir:
Тег предложен российской компанией «Яндекс» в качестве альтернативы атрибуту nofollow...

Пионерскими блогами увлекаетесь?

<noindex> был придумал Дмитрием Крюковым, в Рамблере, году так в 1997-м (прикольно тогда Раблер выглядел). Яндекс его поддержал позже. Атрибута nofollow тогда и в помине не было - какая, нафиг, альтернатива?

ТС, тему валидного noindex-а разрабатывал nickspring, может что найдете в его блоге.

DM
На сайте с 19.10.2007
Offline
20
#9

Спасибо пользователю Богоносец, обнаружил, что приведенная мною выше конструкция некорректно обрабатывается и Яндексом, он просто самостоятельно, видимо, определил шапку сайта и не учитывает её при анализе.

Вот такая вот штука находится в первой строчке страниц

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

Получается, что подобная конструкция не может быть обработана при таком доктайпе?

L
На сайте с 07.12.2007
Offline
351
#10
deMidgard:
Вот такая вот штука находится в первой строчке страниц
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

Получается, что подобная конструкция не может быть обработана при таком доктайпе?

Не может. Нужен доктайп с XHTML - в нём <![CDATA[...]]> является CDATA секцией. А в HTML это просто фальшивые комментарии.

Выберите какой-нибудь XHTML 1.0 (HTML compatible).

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий