Как обзывается кодировка в урле выдачи поисковиков.

Garin&Klubok
На сайте с 22.11.2002
Offline
111
11604

Народ, подскажите плиз

1. Что за кодировка в урле выдачи яндекса, гугла?

после text=

text=%F7%F2%EE%20%E7%E0%20%EA%EE%E4%E8%F0%EE%E2%EA%E0%20%E2%20%F3%F0%EB%E5%20%FF%ED%E4%E5%EA%F1%E0

2. И как можно пакетно перекодировать содержание текстового файла с кирилицей win-1251

в эту кодировку.

к примеру есть 1000 разных фраз типа: "что за кодировка в урле яндекса"

и надо их перекодировать в "%F7%F2%EE%20%E7%E0%20%EA%EE%E4%E8%F0%EE%E2%EA%E0%20%E2%20%F3%F0%EB%E5%20%FF%ED%E4%E5%EA%F1%E0"

KlubOK - управление качеством (http://www.klubok.net/) Мой канал YouTube (https://www.youtube.com/user/garinklubok)
L
На сайте с 01.09.2008
Offline
1
#1
Garin&Klubok:
Народ, подскажите плиз

1. Что за кодировка в урле выдачи яндекса, гугла?
после text=

text=%F7%F2%EE%20%E7%E0%20%EA%EE%E4%E8%F0%EE%E2%EA%E0%20%E2%20%F3%F0%EB%E5%20%FF%ED%E4%E5%EA%F1%E0

2. И как можно пакетно перекодировать содержание текстового файла с кирилицей win-1251
в эту кодировку.

к примеру есть 1000 разных фраз типа: "что за кодировка в урле яндекса"
и надо их перекодировать в "%F7%F2%EE%20%E7%E0%20%EA%EE%E4%E8%F0%EE%E2%EA%E0%20%E2%20%F3%F0%EB%E5%20%FF%ED%E4%E5%EA%F1%E0"

16-ричные цифры после процентов -- это код каждой буквы, не уверен насчет точной кодировки. А в ПХП, например, это можно сделать с помощью фунцкии urlencode()

xooChat (http://xoochat.ru/) web чат поддержки на Вашем сайте.
S
На сайте с 03.09.2008
Offline
78
#2

делай так text=что за кодировка в урле яндекса и все получится

%F7 - это шеснацетеричный номер буквы, код символа проще говоря

и помоему это не яндекс так делает а сам броузер русские буквы приводит к такому виду, т.к. в урле поидее должна быть только латиница

P
На сайте с 04.12.2007
Offline
8
#3

"Символы, которые не могут быть отправлены по сети (все кроме латиницы, цифр и ряда знаков), предварительно кодируются с помощью алгоритма x-www-form-urlencoded. Байты кодировки заменяются на последовательности вида %XX. Вместо XX подставляются две шестнадцатеричные цифры (http://www.faqs.org/rfcs/rfc1738). Стоп. Самый главный вопрос: x-www-form-urlencoded – это кодировка или нет? Традиционно под кодировкой понимают комбинацию набора символов и схемы кодирования. Например, когда говорят utf-8, то подразумевают схему кодирования utf-8 и набор символов Unicode, ровно, как и для utf-16. А если вы слышите windows-1251, то здесь название кодировки дано по названию набора символов. Т.к. как такового отдельного алгоритма кодирования цифры, под которой в данном наборе фигурирует, например, буква “Ы” - нет. Просто 8 бит – бери и пиши их в файл как есть, без каких-либо дополнительных преобразований. Так что x-www-form-urlencoded – это не кодировка, это способ отправить те самые байты, в которые было выполнено преобразование строки текста согласно некоторой “настоящей” кодировке (точнее схеме кодирования). Следовательно, если я открываю адрес вида: http : //Мой-сайт.ru/ящики_с_пивом

То, в зависимости от используемой кодировки, данные будут отправлены либо так:

%FF%F9%E8%EA%E8_%F1_%EF%E8%E2%EE%EC - так выглядит слово “ящики с пивом” в кодировке windows-1251

%D1%8F%D1%89%D0%B8%D0%BA%D0%B8_%D1%81_%D0%BF%D0%B8%D0%B2%D0%BE%D0%BC – а так выглядит это слово в кодировке utf-8.

Возвращаясь к анализу двух примеров запроса данных, мы нигде не видим указания на то какая кодировка используется для отправки данных. Может, у меня не правильный браузер, и какие то другие, правильные, браузеры указывают кодировку отправляемых данных? Увы, ни internet explorer 6,7 ни firefox 2,3 ни opera 9.5 не указывают сведений о кодировке."

Источник:

http://www.black-zorro.com/mediawiki/Java_ru_1#.D0.A2.D0.B8.D0.BF.D0.BE.D0.B2.D1.8B.D0.B5_.D0.BF.D1.80.D0.BE.D0.B1.D0.BB.D0.B5.D0.BC.D1.8B_.D1.81_.D0.BA.D0.BE.D1.82.D0.BE.D1.80.D1.8B.D0.BC.D0.B8_.D1.81.D1.82.D0.B0.D0.BB.D0.BA.D0.B8.D0.B2.D0.B0.D1.8E.D1.82.D1.81.D1.8F_java-.D1.80.D0.B0.D0.B7.D1.80.D0.B0.D0.B1.D0.BE.D1.82.D1.87.D0.B8.D0.BA.D0.B8

Garin&Klubok
На сайте с 22.11.2002
Offline
111
#4

livechatr и pivonoff спасибо

Кстати, нашел программку которой пакетно можно преобразовывать кириллицу в 16ые символы

Называется UltraEdit 14.20

Открываешь в ней свой файл, во вкладке Edit выбираешь HEX functions - Hex edit

Потом как выберешь hex edit - текст отобразится в 16-й системе

Копируешь его (через правую кнопку мышки - HEX COPY) и вставляешь в текстовый файл.

А дальше подчищаем все ненужное

Anarchist
На сайте с 23.07.2008
Offline
185
#5

если че, можу посоветовать страничку:

http://ha.ckers.org/xss.html

там про XSS но все же есть и полезное для ТС

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий