Русские буквы в URL'ах

MN
На сайте с 03.07.2005
Offline
2
1022

Всем привет! Не нашел нигде вразумительного ответа на вопрос: Как индексируются урлы типа http://site.ru/слово.htm?

Спасибо!

[Удален]
#1

Нормально индексируются. Такие урлы при запросах к серверу перекодируются в соответствии со стандартами. Проще всего перейти по такой ссылке в Эксплорере, и посмотреть в адресной строке что получится - вот это и будет кодированный урл.

W
На сайте с 18.06.2005
Offline
26
#2
MITROFAN:
Всем привет! Не нашел нигде вразумительного ответа на вопрос: Как индексируются урлы типа http://site.ru/слово.htm?
Спасибо!

Так же как и показываются в адресной строке http://site.ru/%F1%EB%EE%E2%EE.htm

Но с другой стороны, можешь же и сам проверить, сделав подобную страничку.

Artisan
На сайте с 04.03.2005
Offline
375
#3

Это нарушение стандарта а если где то иногда работает то не обязательно будет работать везде и всегда.

www.leak.info / ДАРОМ линки конкурентов и забытых доменов
W
На сайте с 18.06.2005
Offline
26
#4
Artisan:
Это нарушение стандарта а если где то иногда работает то не обязательно будет работать везде и всегда.

Насколько я понял из RFC нарушения в этом никакого нет. Главное чтобы файловая система вам позволяла такие имена давать. Единственное, что требуется - это давать ссылку и обращаться к этому ресурсу, используя байт-кодированную форму (с процентиками). Но это, естественно, сводит на нет применимость таких URL для раскрутки. Хотя можно попробовать одурачить русский Гугл, вдруг он слово тоже перекодирует.

Artisan
На сайте с 04.03.2005
Offline
375
#5

http://www.w3.org/Addressing/URL/uri-spec.html

Unsafe characters

In canonical form, certain characters such as spaces, control characters, some characters whose ASCII code is used differently in different national character variant 7 bit sets, and all 8bit characters beyond DEL (7F hex) of the ISO Latin-1 set, shall not be used unencoded. This is a recommendation for trouble-free interchange, and as indicated below, the encoded set may be extended or reduced.

S
На сайте с 16.01.2005
Offline
60
#6

А ещё к вопросу о кодировках в уникоде это будет уже

http://site.ru/%D1%81%D0%BB%D0%BE%D0%B2%D0%BE.htm

W
На сайте с 18.06.2005
Offline
26
#7
Artisan:
Unsafe characters

In canonical form, certain characters such as spaces, control characters, some characters whose ASCII code is used differently in different national character variant 7 bit sets, and all 8bit characters beyond DEL (7F hex) of the ISO Latin-1 set, shall not be used unencoded. This is a recommendation for trouble-free interchange, and as indicated below, the encoded set may be extended or reduced.

Ну я так и сказал. Файл именуйте русскими буквами, если файловая система позволяет, а ссылки придется давать байт-кодироваными. shall not be used unencoded - не должен быть использован в незакодированном виде. Так я и сказал. Да, упоминания о том, что "это может быть отменено" в приведенном вами отрывке не содержится. Но из него понятно, что никакого практического смысла так файлы именовать нет.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий