Необычные escape-последовательности в URL

bondarev.pp.ru
На сайте с 29.09.2005
Offline
202
743

Нужно отпарсить URL, достать оттуда GET переменные. Встретился с необычными escape-последовательностями, которые не декодируются функцией urldecode()

Вот пример:

%u043F%u0440%u043E%u0432%u0435%u0434%u0435%u043D%u0438%u0435 %u0434%u0435%u0442%u0441%u043A%u0438%u0445 %u043F%u0440%u0430%u0437%u0434%u043D%u0438%u043A%u043E%u0432 %u0432 %u0421%u0430%u043D%u043A%u0442-%u041F%u0435%u0442%u0435%u0440%u0431%u0443%u0440%u0433%u0435

Что зашифровано в этой строке? Как ее расшифровывать?

В UTF первый байт кирилических символов всегда D0 или D1 вроде, а тут везде 04 (в URF байт 04 и вовсе был бы однобайтовым символом).

bondarev.pp.ru добавил 24.06.2008 в 12:51

Строка взята из параметра в go.mail.ru из моих логов, в котором должен быть поисковый запрос. Если вбить целиком URL в адресную строку, сам go.mail.ru не расшифровывает запрос, оставляет как есть, и ничего не находит. Возможно, он работает с такими escape-последовательностями только при конкретном Accept-Charset

bondarev.pp.ru добавил 24.06.2008 в 14:21

Разобрался. Это UTF-16, которая достаточно легко преобразуется в UTF-8

bondarevpipes.com (http://ru.bondarevpipes.com/)
Progr@mmer\.
На сайте с 14.10.2007
Offline
44
#1

Поздно спохватился. :)

уже решили вопрос.

Вашей девушке не хватает романтики? Черпните её на сайте «Я Люблю Романтику» (http://iloveromantics.ru/). Романтический форум (http://forum.iloveromantics.ru/) для отдыха от нудной работы.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий