Некорректная обработка конструкции <![CDATA[<noindex>]]>

20

deMidgard

29 апреля 2010, 08:25

2993

На сайте используется следующая конструкция:

<span style="display:none"><![CDATA[<noindex>]]></span>

Главная

<span style="display:none"><![CDATA[</noindex>]]></span>

Яндекс замечательно с этой конструкцией справляется. Однако гугл (равно как и SharePoint Search Server) показывают в выдаче следующее (в html):

]]&gt;Главная]]&gt;

В чем может заключаться проблема?

http://www.mwoa.ru (http://www.mwoa.ru) - Midgard's World of Art

170

dimmu-borgir

29 апреля 2010, 10:04

#1

deMidgard:
На сайте используется следующая конструкция:

<span style="display:none"><![CDATA[<noindex>]]></span>

Главная

<span style="display:none"><![CDATA[</noindex>]]></span>

Яндекс замечательно с этой конструкцией справляется. Однако гугл (равно как и SharePoint Search Server) показывают в выдаче следующее (в html):

]]&gt;Главная]]&gt;

В чем может заключаться проблема?

Быть может вам это поможет-

noindex — имя не входящего в официальную спецификацию тега языка гипертекстовой разметки веб-страниц HTML, предназначенного для включения в него частей веб-страниц, не предлагаемых к индексации поисковыми системами.

Тег предложен российской компанией «Яндекс» в качестве альтернативы атрибуту nofollow и в настоящее время распознаётся российскими поисковыми системами Яндекс[1] и Рамблер[2].

DM

20

deMidgard

29 апреля 2010, 10:14

#2

Я знаю про валидность тега noindex, для этого некоторые умы воспользовались методом оборачивания тега в CDATA. Весь текст внутри CDATA вроде бы должен восприниматься как текст, однако этого не происходит, точнее это происходит в случае с Яндексом.

Гугл (как и SharePoint) где-то ломается, в результате чего в выдаче обоих систем могут появиться совершенно нерелевантные запросу страницы.

Хотелось бы разобраться, почему Гугл воспринимает эту конструкцию с ошибкой.

481

Василий Ткачев

29 апреля 2010, 10:17

#3

я бы вообще не советовал юзать ноуиндекс

Продвигаем естественно ( http://www.inetessentials.ru/ ) и непринужденно. Практический курс по оптимизации ( https://allintop.ru/optimization/ ) - без воды и на основе сайтов студентов. Ежегодная конференция All in Top Conf (https://www.allintopconf.ru/)

170

dimmu-borgir

29 апреля 2010, 10:20

#4

inetessentials:
я бы вообще не советовал юзать ноуиндекс

В чем причина?

S

12

stem

29 апреля 2010, 19:43

#5

А какой у Вас doctype - xhtml? Проверьте

481

Василий Ткачев

29 апреля 2010, 21:04

#6

dimmu-borgir:
В чем причина?

если вы вдумаетесь в чем причина, поймете...

ну или поставите эксперименты, например...

781

богоносец

29 апреля 2010, 22:34

#7

deMidgard:
В чем может заключаться проблема?

В том, что ПС не спешат в этом всём разбираться, у них просто нет заинтересованности.

deMidgard:
про валидность тега noindex, для этого некоторые умы воспользовались методом оборачивания тега в CDATA.

И чего получается? + вариант валидации, а функция noindex выполняется.

На сайте используется следующая конструкция:

<span style="display:none"><![CDATA[<noindex>]]></span>

Главная

<span style="display:none"><![CDATA[</noindex>]]></span>

Яндекс замечательно с этой конструкцией справляется.

И действительно не ищет слово =Главная= при ограничении по урлу? Если да, то хочу пример в ЛС.

Что мешает это сделать скриптом?

Google Updates - апдейты Страницы в индексе, но Тревожно насчет fozzy.ru

L

351

Ladycharm

30 апреля 2010, 03:15

#8

dimmu-borgir:
Тег предложен российской компанией «Яндекс» в качестве альтернативы атрибуту nofollow...

Пионерскими блогами увлекаетесь?

<noindex> был придумал Дмитрием Крюковым, в Рамблере, году так в 1997-м (прикольно тогда Раблер выглядел). Яндекс его поддержал позже. Атрибута nofollow тогда и в помине не было - какая, нафиг, альтернатива?

ТС, тему валидного noindex-а разрабатывал nickspring, может что найдете в его блоге.

DM

20

deMidgard

30 апреля 2010, 06:53

#9

Спасибо пользователю Богоносец, обнаружил, что приведенная мною выше конструкция некорректно обрабатывается и Яндексом, он просто самостоятельно, видимо, определил шапку сайта и не учитывает её при анализе.

Вот такая вот штука находится в первой строчке страниц

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

Получается, что подобная конструкция не может быть обработана при таком доктайпе?

L

351

Ladycharm

30 апреля 2010, 09:09

#10

deMidgard:
Вот такая вот штука находится в первой строчке страниц
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

Получается, что подобная конструкция не может быть обработана при таком доктайпе?

Не может. Нужен доктайп с XHTML - в нём <![CDATA[...]]> является CDATA секцией. А в HTML это просто фальшивые комментарии.

Выберите какой-нибудь XHTML 1.0 (HTML compatible).

Что такое Power BI и зачем это нужно бизнесу

Open AI тестирует память для ChatGPT