Отношение поисковиков к XML-стандартам

M
На сайте с 05.01.2003
Offline
31
1132

Здраствуйте!

Очень приятный и полезный Форум. Всегда с интересом читаю, а сейчас решил задать несколько вопросов.

Есть ли на сегодня (или может планируется в будущем) известные поисковиковики, которые индексируют XML, отличный от XHML (например какой-то ArticleML)?

Обращают ли внимание поисковики на качество ( с точки зрения XML) HTML-документов (DOCTYPE, незакрытые теги и прочее) и на форматирование в стиле XML (CSS, XSL)?

ІТ-Аналітика (http://it.ridne.net) - аналітичні матеріали світу інформаційних технологій
LD
На сайте с 12.06.2002
Offline
71
#1

CSS -- это не форматирование в стиле XML. В XML вообще нет форматирования. XSL -- это тоже не форматирование в стиле XML -- это язык трансформаций, по сути (eXtensible Stylesheet Language, по-моему). Трансформация выполняется интернет эксплорером, например. Или на сервере, что гораздо чаще -- но совсем незаметно. Едва ли в поисковики встроен XSL-трансформер. да и на DOCTYPE им начхать, скорее всего. Думается, что поисковики просто вычищают HTML-тэги (ну с оговорками типа атрибута alt для тега IMG в случае Рамблера) -- и поэтому на незакрытые тэги внимания не обращают.

По поводу индексации XML: был сайт Andy Taler'а -- сделанный на XML+XSL-трансформация на клиенте. В Яндексе я его видел в выдаче. Теперь сайта нет, так что проверить нельзя.

M
На сайте с 05.01.2003
Offline
31
#2

Насколько я знаю, XSL имеет две части - трансформирование и собственно форматирование. А то что какой-то сайт показывался Яндексом - уже частичный ответ на мой вопрос. Спасибо Вам.

Под форматированием в стиле XML я понимал в вопросе внешнюю форматизацию документа (без всяких там FONTS) согласно рекомендациям W3C.

AiK
На сайте с 27.10.2000
Offline
257
AiK
#3

mathematician, чтобы не было проблем с пониманием, как большинство поисковиков относится к различным модным технологиям, установите себе культовый браузер lynx. Все вопросы отпадут.

А

например какой-то ArticleML
никто кроме автора не знает как интерпретировать, поэтому поисковик опустит все неизвестные ему тэги, и оставшуюсь часть проиндексирует как обычный текст.
LD
На сайте с 12.06.2002
Offline
71
#4
Насколько я знаю, XSL имеет две части - трансформирование и собственно форматирование

Вы знаете неправильно. Потому что это не совсем так :) Там нет, строго говоря, ни того, ни другого :) XSL-файл -- это просто инструкции по преобразованию одного XML в другой. Так что "форматирования" в том смысле, в каком Вы его понимаете, там быть не обязано. А трансформирование выполняет не сам XSL, а XSL-трансформер :)

Cossack
На сайте с 17.12.2002
Offline
279
#5
культовый браузер lynx

ик, и будете всегда видеть одну и ту же картинку на экране

😂

Сходили бы перед этим на http://www.w3schools.com/xml/default.asp и http://www.w3schools.com/xsl/default.asp - развлеклись. :D А потом можно и на http://www.w3.org/TR/xsl/ ...

Прощание славянки... (http://www.youtube.com/watch?v=0xf9lFMWfKw)
AiK
На сайте с 27.10.2000
Offline
257
AiK
#6
и будете всегда видеть одну и ту же картинку на экране

Ну это смотря откуда руки растут у ставившего браузер и писавшего сайт :D

Для любителей тотального онлайна ссылка:

http://www.delorie.com/web/lynxview.html

или там же

http://www.delorie.com/web/ses.cgi

Ладно, все перечислять не буду, но там ещё парочка ценных ссылок имеется :)

I
На сайте с 27.12.2002
Offline
2
#7

Пока есть любители альтернативных броузеров, все равно приходится делать вариант чистого HTML специально для них. Т.ч. вопрос имеет чисто теоретическое значение (имхо).

Cossack
На сайте с 17.12.2002
Offline
279
#8

так пользуйтесь PHP...

LD
На сайте с 12.06.2002
Offline
71
#9

Обнаружил, к собственному удивлению, что Google индексирует и указывает в выдаче RDF документы...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий