Яндекс индексирует мусорные страницы

Н
На сайте с 09.02.2018
Offline
41
617

Здравствуйте, сайт на ucoz выдает поисковым роботам мусорные урлы с редиректом. К примеру нормальные урлы выглядят так:

1. Страницы с категориями: домен/download/категория/1

2. Страницы с материалами: домен/download/категория/материал/25-1-0-97

Но есть большое НО - в яндексе уже 4600 мусорных страниц, а в гугле 500. Выглядят они так:

/download/категория/материал/download/категория/11

/download/категория/материал/download/категория/4

/download/категория/материал/download/категория/24

И таких тысячи. То есть урлам дописывается повторно /download/категория/ и цифра категории и это всё редиректится на категории. В яндексе 4600 страниц загружено, а в индексе только 400. Допустим через год уже будет 40.000 загруженного мусора, а в индексе будет 4.000 страниц нормальных - это не норма.

Написал яндексу, он ответил мол в robots.txt вбивать эти урлы, но сами понимаете тысячи страниц в ручную туда добавлять это такое себе занятие. Можно ли как-то запретить их индексацию проще?

Теперь объясню как эти урлы роботы вообще увидели. Мой верстальщик в меню сайта случайно забыл добавить "/" перед урлами вот так:

<a href="download/категория/1" class="flex-row">название категории</a>

Поэтому на всех страницах, где есть меню сайта - робот загружал многочисленные мусорные страницы с редиректом. :gm:

С такой ошибкой сайт простоял 1-2 недели, потом я её пофиксил и с того момента прошло уже 1.5 месяца. Поисковые роботы по прежнему обходят эти мусорные страницы и загружают их. Почему роботы продолжают этот мусор загружать спустя 1.5 месяца? И как вообще остановить это безумие?

Xammer2000
На сайте с 10.08.2011
Offline
188
#1
Написал яндексу, он ответил мол в robots.txt вбивать эти урлы, но сами понимаете тысячи страниц в ручную туда добавлять это такое себе занятие

так ты в роботсе по маске запрещай индексацию, а не каждую страницу в отдельности

Самый удобный сервис комментов и репостов ( http://qcomment.ru/ref/123163 ) Позиции и апдейты проверяю тут ( https://tinyurl.com/tvefbe4 )
Н
На сайте с 09.02.2018
Offline
41
#2
Xammer2000:
так ты в роботсе по маске запрещай индексацию, а не каждую страницу в отдельности

А как это сделать, если название материала везде разное? Можно наглядный пример? На примере этого URLa:

/download/категория/материал/download/категория/11

Лишнее в данном урле /download/категория/11

Материалов сотни разных и на каждом десятки разных категории приписано.

---------- Добавлено 13.03.2019 в 09:54 ----------

нужна какая-то переменная, заменяющая /материал/

Станислав Романенко
На сайте с 05.09.2007
Offline
325
#3

Disallow: /*/*/*/download/

Сайт не лезет в топ? Сделаю аудит без воды всего за 8000 рублей! Отзывы клиентов тут (https://searchengines.guru/ru/forum/939454), почта для связи: ingref@ya.ru Посмотрю, в чём проблема с вашим сайтом, за 100 рублей (https://searchengines.guru/ru/forum/comment/15662080).
Н
На сайте с 09.02.2018
Offline
41
#4
Ingref:
Disallow: /*/*/*/download/

Большое спасибо! Реально работает.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий