Спец символы в url

12
vrodeden
На сайте с 12.03.2011
Offline
157
#11
burunduk:
vrodeden, а пишите что обрабатываете параметры

Честно говоря не шибко силен в этой терминологии, что я делаю? Какие параметры отрабатываю, и где я про это писал? Может я что не так понял?

Видеочат Встречи.su (https://встречи.su) . Онлайн знакомства без регистрации.
[Удален]
#12
vrodeden:
Какие параметры отрабатываю, и где я про это писал? Может я что не так понял?
burunduk:
вы уверены что сможете всё это корректно обрабатывать?
vrodeden:
Да 10 лет обрабатывается. Никаких проблем именно в работе не замечал.

я вам привёл проблему нагенерить такое количество url не составляет проблем, более того яндекс несколько раз ловили на изменении порядка параметров - это всё дубли и в совсем не сложно устроить проблемы с индексацией ;)

vrodeden
На сайте с 12.03.2011
Offline
157
#13

ну вид урла как раз сейчас и планирую поменять. скрыть гет запросы. потмоу и задал вопрос постов на 5 выше Про Васю пупкина. планирую примерно такого вида сделать.

похабные запросы и лишние гет параметры тоже проверю. спасибо надоумили.

я что то и не понял сразу что за пример вы показали.

vrodeden
На сайте с 12.03.2011
Offline
157
#14

А насколько вообще опасны левые гет запросы?

попробовал три популярных сайта. нигде нет 404

https://vk.com/feed?порносайт=голыетелочки

https://www.yandex.ru/?порносайт=голыетелочки

https://www.google.ru/?порносайт=голыетелочки

богоносец
На сайте с 30.01.2007
Offline
753
#15

Опасны не левые запросы, а ответы 200 по произвольным запросам.

Это создаёт угрозу подсовывания т.н. дублей ПС, которым с ними приходится бороться.

Т.е. вы не поняли что вам пытались объяснить целую страницу. Поэтому вам не надо отступать от дебильных рекомендаций: токмо латиницу и т.п. На серваке вы все варианты правильно не обработаете, и даже не поймёте, для чего и зачем это нужно.

Вот они умеют коректно понимать всё (или хотя бы многое из возможного):

www.google.ru/search?q=%FF

www.google.ru/search?q=%D1%8F

www.google.ru/search?q=я

Википедия тоже на запрос ru.wikipedia.org/wiki/%FF отвечает 301 Location: https://ru.wikipedia.org/wiki/%D0%AF, вообще её создатель предусмотрителен.

https://ru.wikipedia.org/wiki/Url#.D0.9A.D0.BE.D0.B4.D0.B8.D1.80.D0.BE.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5_URL

vrodeden
На сайте с 12.03.2011
Offline
157
#16
богоносец:
Опасны не левые запросы, а ответы 200 по произвольным запросам.

Т.е. вы не поняли что вам пытались объяснить целую страницу. Поэтому вам не надо отступать от дебильных рекомендаций: токмо латиницу и т.п. На серваке вы все варианты правильно не обработаете, и даже не поймёте, для чего и зачем это нужно.

Насколько я понимаю, здесь обсуждаются технические вопросы. А не потенциалы человека.

Или вы через монитор диагнозы ставите, решате кто поймет и настроит, а кто нет?

Бурундуку спасибо, показал пример, того как подставлять, левые гет запросы.

Думаю в этом направлении. Уже с ночи на других форумах советуюсь о техническом решении.

А вы почему то до сих пор убеждены, что я не понял. что странички могут отдавать 200 ответы на ненужные запросы. Хотя я даже 3 примера привел таких страничек.

Лучше объясните, в чем именно разница между кириллицей и спец символами и латиницей?

По данному вопросу. Понятно, что нужно запретить такие символы как ? и &.

или разрешить всего несколько. Как в принципе у меня и сделано.

в остальном, чем такой левый запрос ?porno=shluhi

Безопаснее чем ?porno=©шлюхи©

в чем дополнительная уязвимость для сервера?

что на латинице, что на кириллице со спец символами, посылается хрень.

Или вы имели ввиду , что в РНР и htaccess будет сложнее прописать условия для проверки?

богоносец
На сайте с 30.01.2007
Offline
753
#17
vrodeden:
в чем именно разница между кириллицей и спец символами и латиницей?

https://ru.wikipedia.org/wiki/Url#.D0.9A.D0.BE.D0.B4.D0.B8.D1.80.D0.BE.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5_URL

Сделайте страницу

<html><head><meta http-equiv="Content-Type" content="text/html; charset=windows-1251"></head>

<body><a href="©шлюхи©">©шлюхи©</a>
</body></html>

 ©шлюхи©


GET
или
GET
Есть зависимость от кодировки страницы, на которой будет сцылка ©шлюхи©

И на эти варианты надо праильно ответить.

А некоторые символы на некоторых страницах вообще не отобразятся ☠стрАница☭

Поэтому

☭ == %E2%98%AD // ну погуглите символ

☠ == %E2%98%A0 // такие символы отобразятся на любом форуме,

поэтому

☠стрАница☭

==

А с латиницей проще:


GET

А если бы HTTP придумали в МО совка...

vrodeden
На сайте с 12.03.2011
Offline
157
#18

Спасибо за ответ. Но с кодировкой, обработкой и выводом страниц вроде бы проблем и не было.

может потому, что слишком экзотические спец символы запрещены.

изначально интересовал вопрос индексации.

думаю если подытожить, то :

1. Универсальные и распространенные спец символы не запрещены и поисковиками индексируются.

2. есть проблема с подставными гет запросами если они отдают код 200, но она не зависит от наличия или отсутствия спец символов, (за исключением &?)

3. Могут быть проблемы с обработкой сервером get запросов.

4. Может я что то упустил, или не так понял?

богоносец
На сайте с 30.01.2007
Offline
753
#19

0. Вы не контролируете кодировку страниц со ссылкой на вашего подопытного. А лишь надеетесь, что она будет utf-8

1. Вы 2 раза не прочитали сцылку на википедию. Никаких символов, кроме латиницы+, в URL не передаётся по HTTP. Хотя вы их видите и недавно они даже стали искаться www.google.ru/search?q=☻ // раньше нет, но были в подсказках, т.е. ползатели активно пытались. Ну теперь и яндексоидам придётся... вообще ПС ищут не слова, а наборы символов.

2. Есть возможность возникновения проблем из-за овета 200 по произвольным запросам.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий