XML+XSLT

126

admad

21 июня 2006, 18:21

956

Вопрос в следующем - есть идея перевести сайт на XML+XSLT. Поделитесь опытом рлиз, а то не нашел инфы, как индексируют поисковики подобную связку? Может у кого есть опыт продвижения таких сайтов.

386

dkameleon

21 июня 2006, 22:18

#1

admad:
как индексируют поисковики подобную связку?

Гугль говорит анкноун тайп, но контент индексирует (правда, недавно сайт пропал из индекса). Это в случае Клиент-сайд парсинга.

В случае сервер-сайд - всё происходит абсолютно прозрачно для поисковиков.

Дизайн интерьера (http://balabukha.com/)

82

Supermakc

21 июня 2006, 23:39

#2

Обычно и чаще всего связка XML+XSLT используется на серверной стороне. То есть достается (выбирается) контент в виде XML, а затем преобразуется с помощью XSLT в благообразный вид - HTML или XHTML. Ну а дальше все как обычно - HTML/XHTML поисковики индексируют отлично :)

Другое дело когда происходит парсинг на стороне клиента. Может быть гугл и индексирует контент, но как вы выделите ключевые моменты на странице в XML? Как выделите заголовки, мета-теги, важные ключевики, ссылки?.. Да и в конце концов, как из серпа будет стоять ссылка на ваш сайт? На XML-файл? Так не все браузеры умеют преобразовывать XML в HTML используя XSLT, пример тому - браузеры мобильных устройств. Я бы рекомендовал использовать парсинг на стороне клиента только в исключительных случаях. Например, когда передаются персонифицированные данные от клиента серверу (админка, CMS, https, клиентская часть). В этом случае, действительно, для уменьшения трафика и нагрузки на сервер можно передавать клиенту данные в виде XML и XSLT, а он сам будет их парсить и отображать. Очень удобно использовать технологию ajaxslt - тут вооще идет асинхронный обмен данными между клиентом и сервером в виде XML.

Ежедневно и бесплатно списки трастовых дроп доменов (http://dropdomains.pro)

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

386

dkameleon

21 июня 2006, 23:49

#3

Supermakc:
Может быть гугл и индексирует контент, но как вы выделите ключевые моменты на странице в XML? Как выделите заголовки, мета-теги, важные ключевики, ссылки?

А что мешает переопределить теги в ХМЛ? ;)

Supermakc:
На XML-файл?

Да, именно так и получается. Сcылка стоит именно на ХМЛ файл. :)

Нашёл-таки в гугле: http://www.worldofwarcraft.com/index.xml

82

Supermakc

22 июня 2006, 00:17

#4

Честно говоря, не понимаю того изврата, который учудили программисты этого сайта :), так как от XML там только заголовок, да несколько тегов. Весь же основной контент содержится в тегах HTML, поэтому гугл его и проиндексировал.

У меня есть сайт, у которого в заголовке стоит что он XML (<?xml version="1.0" encoding="ISO-8859-5"?>) , но весь контент - XHTML, делал чтобы узнать, как только заголовок может повлиять на ранжирование в поисковиках. В общем, никак, рулит контент и старые добрые теги HTML! :)

386

dkameleon

22 июня 2006, 00:54

#5

Supermakc, Вы очень заблуждаетесь :)

Данная страница - это чистейший ХМЛ :)

А тот момент, что переопределены теги - так это скорее всего именно и сделано для обратной совместимости с поисковиками ;)

Взять хотя бы к примеру:

            <div>

              <div/>

            </div>

или:

или:

Это всё абсолютно корректные ХМЛ конструкции и теги, чего не скажешь про ХХТМЛ (речь о ХТМЛ не идёт, так как здесь его кроме как в парных тегах, коими он полностью совпадает с ХХТМЛ, больше нигде и нет).

Полагаю, на данном этапе развития клиент-сайдовых решений ХМЛ+ХСЛТ приходится прибегать к таким уловкам, как совпадающие с ХХТМЛ/ХТМЛ теги, только ради поисковиков, которые по разному воспринимают контент в этих тегах.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

126

admad

22 июня 2006, 04:28

#6

Спасибо за ответы. Смысл ясен - т.е. стоит поэксперементировать с клиент-сайд версией учитывая при этом обратную совместимость с поисковиком. Просто я подумал что при представлении материала в XML можно расположить контент в коде именно так как надо, с CSS версткой это не всегда получается. Да и что то не подумал я что можно определить теги как в HTML :-)

184

Андрей Бондаренко

22 июня 2006, 04:42

#7

Яндекс, рамблер и гугл индексируют такие сайты отлично, а вот с Апортом есть проблемы, так как в адресе страницы могут присутствовать значки типа "?""&", а он этого не любит (помоему даже в его лицензии что то написано), вообщем апорт индексирует через пень колоду((

3 месяца Google не Сайт не индексируется в Яндекс кобласит

153

Коля Дубр

22 июня 2006, 06:17

#8

Я делал XSL-преобразования на клиенте только во всяком back-end, в смысле в админках. Отдавать xml обычным пользователям не пробовал, из тех соображений, что ХЗ что у них за узер-агент: все-таки XSL трансформации поддерживаются далеко не всеми браузерами.

Можно, конечно, делать проверку User-agent, и отдавать старым браузерам html, сгенерированный на сервере. Но тогда, по идее, html надо отдавать и поисковику (он-то точно XSLT не поддерживает), т.е. теряется вся красота затеи. Если же отдавать SE отдельно XML и XSL, можно залететь по статье "клоакинг": все-таки засчет XSL действительно можно убрать из основного кода немало "мусора" (ну, отдавать что-то похожее на версию для печати, а всякую прочую нафигацию приделывать в XSL). Т.е. попасть можно, если придет Платон со старым браузером, глянет код - там одно, нажмет кнопку "посмотреть яндексом" - там другое... хрен чего объяснишь. Хотя, вероятность мала.

Вообще идея неплохая. Надо поизучать состояние XSLT в разных браузерах...

Разрабатываю общую шину (http://habrahabr.ru/company/floxim/blog/268467/) помаленьку. ...а еще у меня есть бложек (http://www.blogovo.ru/).

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

386

dkameleon

22 июня 2006, 08:14

#9

Rober Artua:
так как в адресе страницы могут присутствовать значки типа "?""&"

Э.... не понял сути. А разве при использовании простого ХТМЛ такие значки всегда отсутствуют?

Коля Дубр:
все-таки XSL трансформации поддерживаются далеко не всеми браузерами.

Поддерживается ИЕ (уже довольно давно), ФФ (тоже порядочно), Опера (начиная с 9 версии) :)

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы