Вопрос по кодировке URL

magistrat
На сайте с 02.06.2012
Offline
43
420

В общем существует следующая ситуация:

в .htaccess прописан механизм преобразования по принципу -

RewriteRule ^петя/([A-Z]+)/$ /?petya=$1 (тут все четко работает)

но робот яши, проиндексировав сайт, половину страниц добавил в поиск а половину исключил. Начал искать в чем проблема, посмотрев в яндекс.вебмастер оказалось что все добавленные страницы имеют урл вида site.ru/петя/tram/ а исключеные вида site.ru/%EF%E5%F2%FF/tram/

т.е. в половине страниц кириллическую составляющую он увидел в кодировке windows-1251 и естественно эти урлы оказались нерабочие...

вот и решил я выкрутится через RewriteRule т.е. рядом с

RewriteRule ^петя/([A-Z]+)/$ /?petya=$1

как-то нужно прикрутить

RewriteRule ^%EF%E5%F2%FF/([A-Z]+)/$ /?petya=$1 (и вот эта конструкция не работает, думаю что проблема с символом %) помогите разобратся как сдлеать ее рабочей...

З.Ы. Пытался максимально доступно объяснить сложившуюся ситуацию....

Милованов Ю.С
На сайте с 24.01.2008
Offline
196
#1

ТС, на какой-либо странице ссылка может быть вида site.ru/петя/fromderevn9

Однако русские символы в УРЛе будут преобразовываться в %кодСимвола.

То есть либо юзать транслит, либо следить однообразностью урлов.

ПС. юг.девочки.алкоголь:) если что не так - простите, но думаю все верно написал

Подпись))
[umka]
На сайте с 25.05.2008
Offline
456
#2

Перекодируйте сначала в utf-8

Лог в помощь!
magistrat
На сайте с 02.06.2012
Offline
43
#3
Милованов Ю.С:

Однако русские символы в УРЛе будут преобразовываться в %кодСимвола.
То есть либо юзать транслит, либо следить однообразностью урлов.

На счет однообразных УРЛов, так в том то все и дело, что они однообразные и гугл 100% проиндексировал корректно, а яндекс половину корректно половину запретил как не существующие....

Перекодировать под транслит уже думал, даже написал скрипт который "транслитерирует" все УРЛы но я не знаю последствий от ПС за такой глобальный ход. (т.е. получатся дубли страниц в индексе, одна с кирилической составляющей, другая обычная).

Вот и решил что наименее болезненный способ это при переходе из вне ботом_яндекса по кодированому урлу, он попадал именно туда куда надо, вот и пытаюсь это реализовать...

---------- Добавлено 08.08.2012 в 09:37 ----------

'[umka:
;10706545']Перекодируйте сначала в utf-8

я не совсем Вас понял, что и зачем перекодировать?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий