<!DOCTYPE... XHTML второй редакци

K
На сайте с 18.01.2006
Offline
1
795

Для тех, кто увлекается валидаторами W3C и качеством контента! В декабре 2005 проверял и индексировал сайт, все было хорошо. В январе 2006 проверил снова LinkChecker-ом - обнаружил, что на каждой странице не работает одна ссылка, причем, как выяснилось - та, что в строке <!DOCTYPE ...>.

Линк полагалось изменить еще в августе 2002 согласно, например, http://www.w3.org/TR/xhtml1/xhtml1-diff.html#docconf, до конца 2005 URL'ы устаревших DTD поддерживалиь вебмастерами сайта www.w3.org, но в декабре - перестали существовать.

Вероятно, если есть DOCTYPE со ссылкой на DTD, возвращающий HTTP 404 Not Found, парсер робота может очень сильно обидеться. Успешно войдя в переписку с Я, комментарий по этой теме пока не получил.

[Удален]
#1
Успешно войдя в переписку с Я, комментарий по этой теме пока не получил.

Бедные сотрудники Яндекса. Какой только херни им вебмастера не пишут. 😂

КА
На сайте с 16.09.2005
Offline
74
#2

IMHO Яндексу плевать на доктайп, равно и как на его полное отсутствие. Доктайпы - они для клиентов визуального отображения контента, а не его парисноговой обработки с целью вычленения текста и ссылок...

Segey
На сайте с 23.08.2005
Offline
404
#3

KLArk,

Это получается такой:

http://www.w3.org/TR/xhtml1/xhtml1-diff.html#docconf,

доктайп теперь не работает?

Я даже не знал про такие :)

Brexit - уже совсем рядом. (https://about-this-model.blogspot.com/2019/03/brexit.html)
[Удален]
#4
Клесс Антон:
IMHO Яндексу плевать на доктайп, равно и как на его полное отсутствие. Доктайпы - они для клиентов визуального отображения контента, а не его парисноговой обработки с целью вычленения текста и ссылок...

Да на URL в общем-то всем плевать, в том числе и клиентам визуального отображения.

Реально скачивать DTD может только валидирующий XML-парсер. Проделывать же подобную операцию с xhtml-документами никому в здравом уме не придет мысль.

K
На сайте с 18.01.2006
Offline
1
#5
Interitus:
Реально скачивать DTD может только валидирующий XML-парсер

К сожалению, как раз сейчас у меня под рукой нет последней версии исходника парсера Яндекса :) Посему, немогу точно сказать, как он анализирует контент, какой диалект языка HTML устанавливает by default!

Я просто предположил (возможно - ошибочно!), что если роботу сообщается язык и, может быть даже, местоположение DTD, что анализ контента и мета-тегов осуществляется с использованием четко регламентированного стандарта.

Признаю, очень большая вероятность того, что все вы правы - имеется! Посмотрим, что ответит Я, ведь наличие проблемы они уже признали и пообещали разобраться.

Если сходите по этой ссылке, увидите, какой DTD правильный для XHTML 1.0 Tr... Зеленым цветом выделена как раз ссылка на DTD, что говорит о том, что это стало предметом изменения второй редакции стандарта XHTML 1.0 - в первой редакции ссылка на DTD была другой! Как раз имелось ввиду, что эта неверная ссылка на DTD ("http://www.w3.org/1999/xhtml/DTD/xhtml1-transitional.dtd" или "http://www.w3.org/TR/xhtml1/DTD/xhtml-transitional.dtd") до конца 2005 поддерживалась, но в январе 2006 - перестала существовать. Второй вариант у меня выдавал 404 ошибку несколько дней назад, а в начале декабря - все было нормально. Первый вариант сейчас выдает HTTP 300 Multiple Choices после долгого ожидания, что наводит на мысль!

[Удален]
#6
К сожалению, как раз сейчас у меня под рукой нет последней версии исходника парсера Яндекса Посему, немогу точно сказать, как он анализирует контент, какой диалект языка HTML устанавливает by default!

Да тут не исходник парсера нужен, а немного здравого смысла и понимания, что такое на самом деле аббревиатура DTD означает.

K
На сайте с 18.01.2006
Offline
1
#7
Interitus:
Да тут не исходник парсера нужен, а немного здравого смысла и понимания, что такое на самом деле аббревиатура DTD означает.

Document Type Definision (DTD) - имхо - условно говоря язык, на котором написан документ. Или я не прав?

[Удален]
#8

Document Type Definision (DTD) - имхо - условно говоря язык, на котором написан документ. Или я не прав?

Ну обозвать и так можно. По сути это один из способов записи синтаксических ограничений (наряду с XML Schema и RELAX NG) для XML-документов. К семантике документа это не имеет ни малейшего отношения, и в парсинге html/xhtml документов - применять это негде и незачем.

K
На сайте с 18.01.2006
Offline
1
#9

От Я ответов больше не получал. Но проблему они мою решили. Несколько часов назад сайт был-таки проиндексирован и попал даже по некоторым важным для меня запросам в Top-10. Возможно, я был не прав. Возможно, DTD никак не связан с парсингом сайтов Яndex-ом.

Для тех, кто сталкивается с проблемами индексации: Добавил сайт в AddURL в начале декабря. Отписал в суппорт о проблеме по истечении 5 недель. Получил ответ через день, а решение проблемы - через две недели. Сомневаюсь, что можно получить результат по проблемам быстрее. Короче - терпение, и еще раз - терпение!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий