Яндекс проигнорировал Canonical, noindex и выкинул сайт из поиска

Stasmotion
На сайте с 16.11.2011
Offline
153
272

Добрый день! Страницы сайта ошибочно признались дубликатами и исключены из индексирования и ранжирования.

При этом полностью проигнорирован атрибут rel="canonical" и запрет на индексирование в robots.txt

Примеры:

Вместо страницы

https://semena-zakaz.ru/catalog/semena/semena-ovoshchey/ogurtsy/
проиндексирована и ранжируется страница
https://semena-zakaz.ru/catalog/semena/semena-ovoshchey/ogurtsy/?SORT_FIELD=PROPERTY_KHIT_PRODAZH&SORT_ORDER=desc 

при этом на странице стоит тег

<link rel="canonical" href="https://semena-zakaz.ru/catalog/semena/semena-ovoshchey/ogurtsy/"/>

кроме того индексация запрещена в robots.txt правилом Disallow: /*sort*

Вместо страницы

https://semena-zakaz.ru/catalog/semena/semena-tsvetov
проиндексирована и ранжируется страница
https://semena-zakaz.ru/catalog/semena/semena-tsvetov/?SORT_FIELD=NAME&SORT_ORDER=desc
при этом на странице стоит тег
<link rel="canonical" href="https://semena-zakaz.ru/catalog/semena/semena-tsvetov/"/>

кроме того индексация запрещена в robots.txt правилом Disallow: /*sort*

В уведомлениях вебмастера:

https://semena-zakaz.ru/catalog/semena/semena-ovoshchey/tomaty/

Старый статус: В поиске

Новый статус: Дубль

Страница дублирует уже представленную в поиске страницу

https://semena-zakaz.ru/catalog/semena/

При этом на страницах абсолютно разный контент и мета-теги.

Позиции полностью рухнули. Кто сталкивался с подобным? Платону отписался.

Комплексное SEO продвижение сайтов, полная отчетность Настройка и ведение Яндекс.Директ
JD
На сайте с 08.12.2008
Offline
471
#1
кроме того индексация запрещена в robots.txt правилом Disallow: /*sort*

Так не правильно.

Станислав Романенко
На сайте с 05.09.2007
Offline
325
#2

Надо не в роботсе закрывать, а через мета-тег noindex.

UPD - Не обратил внимания, что вопрос про Яндекс. Обратите внимание на регистр в robots.txt:


индексация запрещена в robots.txt правилом Disallow: /*sort*

В урле у вас буквы большие, для ПС это разные вещи - https://yandex.ru/support/webmaster/controlling-robot/

Сайт не лезет в топ? Сделаю аудит без воды всего за 8000 рублей! Отзывы клиентов тут (https://searchengines.guru/ru/forum/939454), почта для связи: ingref@ya.ru Посмотрю, в чём проблема с вашим сайтом, за 100 рублей (https://searchengines.guru/ru/forum/comment/15662080).
[Удален]
#3
Stasmotion:
При этом на страницах абсолютно разный контент и мета-теги.

проверяйте доступность сайта, когда абсолютно разные страницы признаются дублями это связано с недоступностью сайта - по всем урлам отдаётся одна заглушка (например, сообщение об ошибке и код ответа 200)

плюс обратите внимание на корректность конечных / в url

Stasmotion:
https://semena-zakaz.ru/catalog/semena/semena-ovoshchey/ogurtsy/
Stasmotion:
https://semena-zakaz.ru/catalog/semena/semena-tsvetov
Stasmotion:
https://semena-zakaz.ru/catalog/semena/semena-ovoshchey/tomaty/

у вас то со слешем на конце, то без, а в каноникл такая же каша?

P.S. и да каноникл для яндекса не указ

Stasmotion
На сайте с 16.11.2011
Offline
153
#4
burunduk:
проверяйте доступность сайта, когда абсолютно разные страницы признаются дублями это связано с недоступностью сайта - по всем урлам отдаётся одна заглушка (например, сообщение об ошибке и код ответа 200)

плюс обратите внимание на корректность конечных / в url




у вас то со слешем на конце, то без, а в каноникл такая же каша?


P.S. и да каноникл для яндекса не указ

Спасибо, Платоны ответили, действительно сервер отдавал Mysql connect error: (2002) Connection refused (400). Но серверные утверждают, что было 8395 обращений от YandexBot, у всех код 200, кроме 43 запросов.

Будем разбираться.

Слеш на конце все норм, редирект стоит, просто так ссылку скопировал.

Но проверка ответа сервера вот такую дичь выдает на внутрненних страницах, описание ошибки не нашел в документации:



---------- Добавлено 13.04.2020 в 17:41 ----------

Ingref:
Надо не в роботсе закрывать, а через мета-тег noindex.
UPD - Не обратил внимания, что вопрос про Яндекс. Обратите внимание на регистр в robots.txt:

В урле у вас буквы большие, для ПС это разные вещи - https://yandex.ru/support/webmaster/controlling-robot/

Поправил, спасибо, не знал про регистр

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий