XML+XSLT

admad
На сайте с 22.06.2004
Offline
126
952

Вопрос в следующем - есть идея перевести сайт на XML+XSLT. Поделитесь опытом рлиз, а то не нашел инфы, как индексируют поисковики подобную связку? Может у кого есть опыт продвижения таких сайтов.

dkameleon
На сайте с 09.12.2005
Offline
386
#1
admad:
как индексируют поисковики подобную связку?

Гугль говорит анкноун тайп, но контент индексирует (правда, недавно сайт пропал из индекса). Это в случае Клиент-сайд парсинга.

В случае сервер-сайд - всё происходит абсолютно прозрачно для поисковиков.

Дизайн интерьера (http://balabukha.com/)
Supermakc
На сайте с 24.03.2006
Offline
82
#2

Обычно и чаще всего связка XML+XSLT используется на серверной стороне. То есть достается (выбирается) контент в виде XML, а затем преобразуется с помощью XSLT в благообразный вид - HTML или XHTML. Ну а дальше все как обычно - HTML/XHTML поисковики индексируют отлично :)

Другое дело когда происходит парсинг на стороне клиента. Может быть гугл и индексирует контент, но как вы выделите ключевые моменты на странице в XML? Как выделите заголовки, мета-теги, важные ключевики, ссылки?.. Да и в конце концов, как из серпа будет стоять ссылка на ваш сайт? На XML-файл? Так не все браузеры умеют преобразовывать XML в HTML используя XSLT, пример тому - браузеры мобильных устройств. Я бы рекомендовал использовать парсинг на стороне клиента только в исключительных случаях. Например, когда передаются персонифицированные данные от клиента серверу (админка, CMS, https, клиентская часть). В этом случае, действительно, для уменьшения трафика и нагрузки на сервер можно передавать клиенту данные в виде XML и XSLT, а он сам будет их парсить и отображать. Очень удобно использовать технологию ajaxslt - тут вооще идет асинхронный обмен данными между клиентом и сервером в виде XML.

Ежедневно и бесплатно списки трастовых дроп доменов (http://dropdomains.pro)
dkameleon
На сайте с 09.12.2005
Offline
386
#3
Supermakc:
Может быть гугл и индексирует контент, но как вы выделите ключевые моменты на странице в XML? Как выделите заголовки, мета-теги, важные ключевики, ссылки?

А что мешает переопределить теги в ХМЛ? ;)

Supermakc:
На XML-файл?

Да, именно так и получается. Сcылка стоит именно на ХМЛ файл. :)

Нашёл-таки в гугле: http://www.worldofwarcraft.com/index.xml

Supermakc
На сайте с 24.03.2006
Offline
82
#4

Честно говоря, не понимаю того изврата, который учудили программисты этого сайта :), так как от XML там только заголовок, да несколько тегов. Весь же основной контент содержится в тегах HTML, поэтому гугл его и проиндексировал.

У меня есть сайт, у которого в заголовке стоит что он XML (<?xml version="1.0" encoding="ISO-8859-5"?>) , но весь контент - XHTML, делал чтобы узнать, как только заголовок может повлиять на ранжирование в поисковиках. В общем, никак, рулит контент и старые добрые теги HTML! :)

dkameleon
На сайте с 09.12.2005
Offline
386
#5

Supermakc, Вы очень заблуждаетесь :)

Данная страница - это чистейший ХМЛ :)

А тот момент, что переопределены теги - так это скорее всего именно и сделано для обратной совместимости с поисковиками ;)

Взять хотя бы к примеру:

            <div>

<div/>
</div>

или:

<div class="phatLootBox-wrapper">
<newsposts/>

</div>

или:

<a href="/community/" style="cursor: hand;">
<span class="phatLootBox-visual comm"/>
</a>

Это всё абсолютно корректные ХМЛ конструкции и теги, чего не скажешь про ХХТМЛ (речь о ХТМЛ не идёт, так как здесь его кроме как в парных тегах, коими он полностью совпадает с ХХТМЛ, больше нигде и нет).

Полагаю, на данном этапе развития клиент-сайдовых решений ХМЛ+ХСЛТ приходится прибегать к таким уловкам, как совпадающие с ХХТМЛ/ХТМЛ теги, только ради поисковиков, которые по разному воспринимают контент в этих тегах.

admad
На сайте с 22.06.2004
Offline
126
#6

Спасибо за ответы. Смысл ясен - т.е. стоит поэксперементировать с клиент-сайд версией учитывая при этом обратную совместимость с поисковиком. Просто я подумал что при представлении материала в XML можно расположить контент в коде именно так как надо, с CSS версткой это не всегда получается. Да и что то не подумал я что можно определить теги как в HTML :-)

Андрей Бондаренко
На сайте с 02.11.2005
Offline
184
#7

Яндекс, рамблер и гугл индексируют такие сайты отлично, а вот с Апортом есть проблемы, так как в адресе страницы могут присутствовать значки типа "?""&", а он этого не любит (помоему даже в его лицензии что то написано), вообщем апорт индексирует через пень колоду((

Коля Дубр
На сайте с 02.03.2005
Offline
153
#8

Я делал XSL-преобразования на клиенте только во всяком back-end, в смысле в админках. Отдавать xml обычным пользователям не пробовал, из тех соображений, что ХЗ что у них за узер-агент: все-таки XSL трансформации поддерживаются далеко не всеми браузерами.

Можно, конечно, делать проверку User-agent, и отдавать старым браузерам html, сгенерированный на сервере. Но тогда, по идее, html надо отдавать и поисковику (он-то точно XSLT не поддерживает), т.е. теряется вся красота затеи. Если же отдавать SE отдельно XML и XSL, можно залететь по статье "клоакинг": все-таки засчет XSL действительно можно убрать из основного кода немало "мусора" (ну, отдавать что-то похожее на версию для печати, а всякую прочую нафигацию приделывать в XSL). Т.е. попасть можно, если придет Платон со старым браузером, глянет код - там одно, нажмет кнопку "посмотреть яндексом" - там другое... хрен чего объяснишь. Хотя, вероятность мала.

Вообще идея неплохая. Надо поизучать состояние XSLT в разных браузерах...

Разрабатываю общую шину (http://habrahabr.ru/company/floxim/blog/268467/) помаленьку. ...а еще у меня есть бложек (http://www.blogovo.ru/).
dkameleon
На сайте с 09.12.2005
Offline
386
#9
Rober Artua:
так как в адресе страницы могут присутствовать значки типа "?""&"

Э.... не понял сути. А разве при использовании простого ХТМЛ такие значки всегда отсутствуют?

Коля Дубр:
все-таки XSL трансформации поддерживаются далеко не всеми браузерами.

Поддерживается ИЕ (уже довольно давно), ФФ (тоже порядочно), Опера (начиная с 9 версии) :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий