Исключенные страницы, "левые" символы в Url

S2
На сайте с 24.12.2016
Offline
7
1653

Здравствуйте!

При очередной проверке сайта в Яндекс Вебмастере зашли в Исключенные страницы и ужаснулись количеству Дублей страниц.

Причем, не можем понять откуда они вообще взялись. К примеру, есть страница http://site.ru/uslugi, а в вебмастере еще куча ее дублей вида http://site.ru/uslugi/Аренда/ и http://site.ru/uslugi/Аренда/Аренда и т.д. и вообще это слово Аренда подставляется чуть не к каждому урлу. Самое страшное сайт по этим адресам доступен.

Подскажите, пожалуйста, откуда это вообще берется?

Понятно, что нужно закрыть от индексации как минимум,

Перевести Аренда в Punycode и добавить директиву Disallow: *xn--80aald4bq*, только вот при проверке Разрешены ли URL? в ЯВ страницы все равно отдают ответ 200

Аренда спецтехники (http://kransib.com/) напрямую от владельца
dma84
На сайте с 21.04.2009
Offline
168
#1

В пуникод переводить не нужно.

Урлы берутся, скорее всего, из-за неверных относительных ссылок в меню, например: <a href="аренда">Аренда</a> без слэша в начале. То, что движок обрабатывает такие УРЛы - исключительно проблема движка и криворуких кодеров.

S2
На сайте с 24.12.2016
Offline
7
#2
dma84:
В пуникод переводить не нужно.

Урлы берутся, скорее всего, из-за неверных относительных ссылок в меню, например: <a href="аренда">Аренда</a> без слэша в начале. То, что движок обрабатывает такие УРЛы - исключительно проблема движка и криворуких кодеров.

Если прописать в robots так

Disallow: *Аренда*

вебмастер выдает ошибку Возможно, был использован недопустимый символ

За относительные ссылки спасибо! Будем смотреть в этом направлении. Хотя cms платная, не ожидали подвоха

[Удален]
#3
salgi25:
Хотя cms платная, не ожидали подвоха

это не показатель почти у всех подобные косяки ;)

P.S. скорей всего там полно проблем, с обработкой url, вплоть до xss

S2
На сайте с 24.12.2016
Offline
7
#4

А поводу закрытия от индексации в файле robots.txt кириллических символов кто-нибудь может подсказать?

Если так Disallow: *Аренда* , то вебмастер выдает ошибку Возможно, был использован недопустимый символ.

Если перевести в пуникод , то при проверке статуса url все равно доступна страница

[Удален]
#5
salgi25:
Если перевести в пуникод , то при проверке статуса url все равно доступна страница

/ в дизаллоу не забыли? Потом проверьте. То есть

Disallow: /*пуникод

[Удален]
#6
salgi25:
А поводу закрытия от индексации в файле robots.txt кириллических символов кто-нибудь может подсказать?

Disallow: /*%

богоносец
На сайте с 30.01.2007
Offline
774
#7

Disallow: *%

% в нижнем регистре!11

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий