К знатокам относительно shtml

M
На сайте с 29.03.2003
Offline
65
#11

Cossack, выдавать по одному адресу разные страницы называется MultiViews :) А процесс определения, что конретно выдавать называется content negotiation. По тебе выходит, что все нормальные мультиязыковые сайты должны быть забанены. Ан нет :)

Проверь свои запросы: Вершки Рунета (http://www.43n39e.ru/)
Cossack
На сайте с 17.12.2002
Offline
279
#12
Прощание славянки... (http://www.youtube.com/watch?v=0xf9lFMWfKw)
Cossack
На сайте с 17.12.2002
Offline
279
#13

Плюс, дополнительно - определение сервером кого-то как англичанина - не факт, что на страницу зашел англичанин. Меня, например, этот форум не определяет, а половина ходит под proxy. Таким образом, выданная страница не будет соответствовать требованиям юзера и не найдя понятного ему языка - он уйдет нафих.

Поисковик же, может иметь 3 сценария:

1. Видеть только один язык в соответствии с его default-настройками, например русский в koi-8, что приведет к индексации только одной версии и к последующему шоку посетителей идущих на русский сайт и получающих идиш ;).

2. Заметит разницу в содержании, но не найдет разницы в ссылках и решит, что это наглый cloaking - и будет удалять, понижать или клеить все в кучу (в зависимости от алгоритма).

3. Будет периодически получать "новые" страницы, удалять "старые" - и сайт будет постоянно колбасить.

Модераторы, которые человеки, могут и не догадаться о наличии серверного редиректа и будут постоянно удалять или перебрасывать сайт из раздела в раздел (а в Zeal - просто внести запрет на индексацию сайта).

Кроме того, будет дикое количество глюков, 406-х и прочих ошибок, в том числе связанных и с наличием UTF-8 у продвинутых юзеров ;).

LP
На сайте с 22.06.2003
Offline
5
#14

Ну хорошо - напугали.... А делать-то что? Сайт абсолютно зеркален - англо-русский, узкопрофильный (так что мне эти рейтинги... и так с дуру в Яндексе на 2-ой день первую позицию занял по нужному запросу) ориентированный на страны СНГ (русский) и всех остальных (английский), а если у самых продвинутых идиш или UTF-8, то это проблемы не сайта...

Вопрос все равно открыт - проиндексируют ли западные поисковики такую конструкцию или нужно что-то изменить...

а кому сейчас легко!?
Cossack
На сайте с 17.12.2002
Offline
279
#15
а если у самых продвинутых идиш или UTF-8, то это проблемы не сайта...

Посетители так думать не будут. И русские в Израиле - местных языков не знают... Не изобретай велосипед.

Вопрос все равно открыт - проиндексируют ли западные поисковики такую конструкцию или нужно что-то изменить...

Лучше разных поддоменов или доменов не придумать. Слишком много плюсов, чтобы ими пренебрегать. Хотя своя рука владыка - попробуй подстановку, только потом с вопросами иди прямо к тем, кто говорил: "шо усе так делают и ниче" ;)...

M
На сайте с 29.03.2003
Offline
65
#16
Как писал Cossack
Плюс, дополнительно - определение сервером кого-то как англичанина - не факт, что на страницу зашел англичанин. Меня, например, этот форум не определяет, а половина ходит под proxy.

<skip>

2. Заметит разницу в содержании, но не найдет разницы в ссылках и решит, что это наглый cloaking - и будет удалять, понижать или клеить все в кучу (в зависимости от алгоритма).

<skip>

Т.е. ты упираешь на то, что писатели поисковиков так и не удосужились прочитать RFC на HTTP, где этот механизм описан и в следствие которого эта ситуация ну никак на клоакинг и прочую гадость не тянет ?

А то, что у некоторых товарищей не настроены языковые предпочтения, или они пользуются проксями, не поддерживающими все фишки HTTP, так это проблема этих товарищей ровно в той же мере, как умение правильно писать, читать, пользовать вилкой и другими плодами цивилизации присущи современному образованному человеку :)

M
На сайте с 29.03.2003
Offline
65
#17
Как писал Leo_p
Вопрос все равно открыт - проиндексируют ли западные поисковики такую конструкцию или нужно что-то изменить...

Насколько я понял, переменную окружения CHARSET выставляет броузер, а русский Апач, если это он, может выбирать кодировку по агенту пользователя. Соответственно, если для агентов западных поисковиков задать английский чарсет, а для русских - вин1251, то проблем быть не должно.

Cossack
На сайте с 17.12.2002
Offline
279
#18

Причем тут charset? Я думал, что тут ясно и так, даже особо тупым ;). Но видимо надо спускать программистов на землю...

В идеале (без глюков, и с очень продвинутыми spiders и users) - поисковик сможет определить, и показать в выдаче, а пользователь, настроив свой browser - сможет увидеть именно то, что было показано поисковиком... что-то вроде somesite.com/index.html.en?

Вопрос: какой ранг будет у документа на который не идут ссылки и где этот документ будет? Поисковик, даже проиндексировав его, не сможет проранжировать и будет скорее всего засовывать его в самое никуда... Значит надо будет ставить прямые ссылки на этот самый somesite.com/index.html.en, что лишает смысла и схему и ее обсуждение...

M
На сайте с 29.03.2003
Offline
65
#19

Cossack, остренький ты наш, лучше давай к программерам на небеса :) сначала RFC по HTTP прочитать, там всё расписано. Если б читал, вопросов бы не возникло...

(Hint: имя файла выбранного для выдачи варианта (index.html.en, к примеру) указывается в заголовке Content-Location).

Cossack
На сайте с 17.12.2002
Offline
279
#20

Сарказм не уместен. Пойми сначала как устроена Сеть. И подумай на досуге: почему debian.org отказались от такой схемы и сделали jp.debian.org, de.debian.org... ;).

Или они не авторитет для тебя? Тогда посмотри на "МелкийСофт", там microsoft.de = microsoft.com/germany/ ;). Лохи все они? Ну тогда нет вопросов. Преклоним головы перед асом программирования.

Hint: Не все что заложено в софте/харде нужно/можно использовать. Особенно глючные фичи, которые могут выдавать 406 - и тем самым просто закрыть доступ поисковиков к сайту. Учи матчасть, знание мануала не делает человека специалистом ;).

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий