ЯнДекС ВЕбМастЕР удаляет и добавляет страницы в разном регистре

12
Resett
На сайте с 10.04.2012
Offline
146
647
Подскажите, пожалуйста, кто знает и у кого такое было. 

Есть страница на сайте, допустим: 
kupit-venik-online

И в Я.вебмастере постоянно вижу такое:
Добавлена страница:
kUpit-VEnik-onlinE
kuPIt-vEniK-oNLine
kUPit-VENik-onLIne
 Удалена страница:
kUpiT-vENiK-oNLinE
KupiT-vEniK-ONliNe

И еще разные вариации, то удаляются то добавляются в индекс.

Сайт на wp, совсем не молодой. У кого такое же было, с чем это может быть связано? 
Антоний Казанский
На сайте с 12.04.2007
Offline
738
#1

1. Разберитесь, что генерирует адреса с переменным регистром (внутренние ссылки или внешние).

Для анализа внутренних - просканируйте сайт краулером типа SC Frog.

2. Разберитесь с настройкой CMS - почему с 200-ым ответом (а иначе страницы не добавлялись бы в индекс) загружаются несуществующие адреса.


Resett :
с чем это может быть связано? 

C неправильной программной настройкой CMS. 

√ SEO продвижение ► https://akazansky.ru - экспертный аудит сайтов ( https://akazansky.ru/audit-sajtov ), внедрение эффективных решений цифрового маркетинга. Разговоры о SEO и не только: культурно, вежливо, доброжелательно ► https://t.me/seotusovochka
Resett
На сайте с 10.04.2012
Offline
146
#2
Антоний Казанский #:

1. Разберитесь, что генерирует адреса с переменным регистром (внутренние ссылки или внешние).

Для анализа внутренних - просканируйте сайт краулером типа SC Frog.

2. Разберитесь с настройкой CMS - почему с 200-ым ответом (а иначе страницы не добавлялись бы в индекс) загружаются несуществующие адреса.


C неправильной программной настройкой CMS. 

Спасибо за ответ. Просто на сайте и на этих страницах нет никаких изменений, ничего не менялось, плагины не добавлялись. Да и эти страницы - если перейти по такой ссылке - просто переходит по адресу страницы. Это так всегда было на wordpress. От регистра адрес не зависит, это не дубли. Просто как эти страницы лезут в индекс Яндекса, непонятно. 

Антоний Казанский
На сайте с 12.04.2007
Offline
738
#3
Resett #:
Просто как эти страницы лезут в индекс Яндекса, непонятно. 

С внешних источников формируются такие ссылки и если сайт с сохранением регистра отдаёт 200-ый результат, то Яндекс начинает индексировать такие страницы.

В принципе можно сказать, что это намеренное вредительство, которое бесконечно формирует бесчисленное множество адресов, которые будут то попадать в индекс, то выпадать из него ввиду дублирования.

Антоний Казанский
На сайте с 12.04.2007
Offline
738
#4

Я сейчас зашёл на оф. сайты WordPress, там тоже присутствует такая уязвимость. Это проблема.

Конечно в рабочей реальности таких ссылок быть не должно, но если кто-то со стороны будет их генерировать для того, чтобы устроить чехарду в индексе, то и такая ситуация становится реальностью.

Надо ставить заплатку, чтобы все входящие GET адреса принудительно переводились в строчный регистр, либо 404 ошибку.

p.s. Как-то уже с пол года была уже кого-то такая проблема (здесь на форуме), так что вы не одиноки и это не случайность.

HM
На сайте с 14.01.2012
Offline
248
#5
Антоний Казанский #:
Это проблема.

У таких страниц вп обычно есть canonical, так что это не проблема. 
Проблема - это когда Яндекс игнорирует этот тег.
Антоний Казанский
На сайте с 12.04.2007
Offline
738
#6
hakuna matata #:
У таких страниц вп обычно есть canonical

И не только у WP.


hakuna matata #:
Проблема - это когда Яндекс игнорирует этот тег.

Именно так. Для Яндекса это не более, чем рекомендация, которая в общем и не является руководствующей.

В пору одной говорящей голове задать вопрос - какого хрена canonical толком не работает в Яндексе, но мы получим, что традиционно работа алгоритмов не обсуждается и вообще это их не интересует, их интересует вертикальный поиск и покупки в обход магазинов.

Ave Яндекс!

alaev
На сайте с 18.11.2010
Online
821
#7
ТС, Яндекс сам такте урл не придумывает.

Либо ботами гуляют, либо через сервисы по индексации.

Проблему нужно пофиксить.
Создание и продвижение сайтов - https://alaev.net , аудиты сайтов, контекстная реклама
HM
На сайте с 14.01.2012
Offline
248
#8
Антоний Казанский #:
Именно так. Для Яндекса это не более, чем рекомендация, которая в общем и не является руководствующей.

Я почему-то думал что ты представитель Яндекса тут :)

Тем не менее (хоть я вообще дорвейшик мимо проходил): регистронезависимость урлов у вп - это плохо. Проблема висит более 10 лет, но всем похер.

Есть у вп проблема ещё смешнее и опаснее - логин админа при авторизации всегда приводится к лоукейсу. Были предложения исправить, но вроде не приняли.


Тред бы перекинуть в сайтостроение.

Антоний Казанский
На сайте с 12.04.2007
Offline
738
#9
hakuna matata #:
Я почему-то думал что ты представитель Яндекса тут :)

Вот представитель Яндекса.  Я никакого отношения к Яндексу не имею.


hakuna matata #:
Проблема висит более 10 лет, но всем похер.

Не удивлён.

HM
На сайте с 14.01.2012
Offline
248
#10

Нет, постойте. Может быть кто-то позже прочитает.

Проблема только в том, что у Яндекса не работает canonical.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий