Яндекс постоянно добавляет несуществующие страницы 404 в индекс. Как это?

12 3
B
На сайте с 23.10.2008
Offline
82
1836

Приветствую!

Есть форум, на несколько разделов и в каждом множество страниц с темами.

Каждая страница раздела отличается последним числом.

http://названиефорума.ru/forum3-20.html

http://названиефорума.ru/forum3-40.html

http://названиефорума.ru/forum3-60.html

Когда добираешся до конца списка тем, то дальше нет ссылок естественно на несуществующие страницы.

Но если ввести несуществующую страницу раздела например http://названиефорума.ru/forum3-400000000.html,

то откроется страничка с 404й ошибкой с нашим заголовком.

В общем Яндекс только и делает что сканирует в бесконечность эти несуществующие страницы разделов, причем добавляет в индекс(!) и спустя какое то время избавляется от них.

Вот для примера 404я страница нашего сайта.

http://sysadmins.ru/forum3-88320.html

Видно что код выдается верный - 404 в заголовке. То есть яндекс не может сказать что это обычная страница, и самое главное - ссылок на всё это нет нигде(!) ваабще. Он просто выдумывает как будто инкременты до бескнечности. Помогите плз!

:beer::beer::beer:

Vladimir
На сайте с 07.06.2004
Offline
587
#1

Плохо 404 отдает...

При первой же проверке 301 -> 200

Аэройога ( https://vk.com/aeroyogadom ) Йога в гамаках ( https://vk.com/aero_yoga ) Аэройога обучение ( https://aeroyoga.ru ) и просто фото ( https://weandworld.com )
Станислав Романенко
На сайте с 05.09.2007
Offline
325
#2

Зайдите сюда https://webmaster.yandex.ru/site/links/internal/ и проверьте, нет ли там этих ваших урлов.

Сайт не лезет в топ? Сделаю аудит без воды всего за 8000 рублей! Отзывы клиентов тут (https://searchengines.guru/ru/forum/939454), почта для связи: ingref@ya.ru Посмотрю, в чём проблема с вашим сайтом, за 100 рублей (https://searchengines.guru/ru/forum/comment/15662080).
B
На сайте с 23.10.2008
Offline
82
#3
Nadejda:
Плохо 404 отдает...
При первой же проверке 301 -> 200

А чем проверять? Искал просто в гугле - "проверка заголовков html" и все проверки показывли 404.

😕

---------- Добавлено 26.09.2019 в 15:45 ----------

Ingref:
Зайдите сюда https://webmaster.yandex.ru/site/links/internal/ и проверьте, нет ли там этих ваших урлов.

Ого хорошая ссылка,но там всего 500 таких документов и датируются мартом и там и правда есть проблемные странички со ссылками на несуществующие. Но яндекс каждый день по 300 новых накидывает и их тут нет. Искал еще на гугле тоже с тегом site: Нету на сайте нигде ссылок на несуществующие страницы точно.

Lazy Badger
На сайте с 14.06.2017
Offline
228
#4
Bengurion:
Вот для примера 404я страница нашего сайта.
http://sysadmins.ru/forum3-88320.html
Видно что код выдается верный - 404 в заголовке.

Не там отдаете 404, а реальный код, как отметила уже Nadejda - не 404

Ответ "http://sysadmins.ru/forum3-88320.html" → Основной робот Яндекса
Код статуса HTTP 301 Moved Permanently
Время ответа сервера 4 мс
IP сайта 95.215.110.66
Кодировка UTF-8(unicode-1-1-utf-8, UTF8)
Размер страницы 178 Б

Не так обрабатывать надо 404, не 301 редиректом, иначе будет иметь то, что имеете

Производство жести методом непрерывного отжига
Станислав Романенко
На сайте с 05.09.2007
Offline
325
#5
Bengurion:
Ого хорошая ссылка,но там всего 500 таких документов и датируются мартом и там и правда есть проблемные странички со ссылками на несуществующие. Но яндекс каждый день по 300 новых накидывает и их тут нет.

Ну так зачем вам все? Вы посмотрите, откуда эти 500 берутся и по аналогии найдите остальные.

B
На сайте с 23.10.2008
Offline
82
#6
LazyBadger:
Не там отдаете 404, а реальный код, как отметила уже Nadejda - не 404



Не так обрабатывать надо 404, не 301 редиректом, иначе будет иметь то, что имеете

Сорри я написал ссылку с http на самом деле ссылка https://sysadmins.ru/forum3-88320.html

А там 301 потому что на https перекидывает. Сорри.
Не нашел "правки" в первом сообщении :(

---------- Добавлено 26.09.2019 в 19:15 ----------

Ingref:
Ну так зачем вам все? Вы посмотрите, откуда эти 500 берутся и по аналогии найдите остальные.

Имею ввиду там реально 500 документов с ошибочными урлами, но разными, не этими копиями страниц с разным номером. Там просто разные ссылки на удаленные темы и еще чтото. А этих ссылок тут нету тоже.

Vladimir
На сайте с 07.06.2004
Offline
587
#7
Bengurion:
Сорри я написал ссылку с http на самом деле ссылка http://sysadmins.ru/forum3-88320.html
А там 301 потому что на https перекидывает. Сорри..

В вебмастере есть Инструменты - Проверка ответа сервера

А, там 8 роботов яндекса, проверяете все, а не только одного

У меня ссылка, не только 200 была помечена, но и в индексе была. И не удалить дубль страницы.

Первый основной робот показывал правильный ответ сервера 301 - а страница в вебмастере 200 и в индексе,

Было перелопачено все! Пока случайно не запросили остальных 7 роботов - а все остальные показали 200

Причина плагин кэширования, просто заменили на другой

B
На сайте с 23.10.2008
Offline
82
#8
Nadejda:
В вебмастере есть Инструменты - Проверка ответа сервера
А, там 8 роботов яндекса, проверяете все, а не только одного

У меня ссылка, не только 200 была помечена, но и в индексе была. И не удалить дубль страницы.
Первый основной робот показывал правильный ответ сервера 301 - а страница в вебмастере 200 и в индексе,
Было перелопачено все! Пока случайно не запросили остальных 7 роботов - а все остальные показали 200
Причина плагин кэширования, просто заменили на другой

Благодарю!

Вот прогнал https через все роботы все одно и тоже показали. Вот.

Но если проверять http то тут конечно 301, но так и было задумано и это рекомендует яндекс при переезде на https. Проверил ни один робот 200 не показывет.

Станислав Романенко
На сайте с 05.09.2007
Offline
325
#9
Bengurion:
Имею ввиду там реально 500 документов с ошибочными урлами, но разными, не этими копиями страниц с разным номером. Там просто разные ссылки на удаленные темы и еще чтото. А этих ссылок тут нету тоже.

У Гугла есть аналогичный раздел https://search.google.com/search-console/links - там под внутренними ссылками нажимаете "Дополнительно", ищите ваши урлы, и если они там есть, то по нажатию появляется список страниц, откуда на них есть ссылка.

B
На сайте с 23.10.2008
Offline
82
#10
Ingref:
У Гугла есть аналогичный раздел https://search.google.com/search-console/links - там под внутренними ссылками нажимаете "Дополнительно", ищите ваши урлы, и если они там есть, то по нажатию появляется список страниц, откуда на них есть ссылка.

Очень много интересного нашел, но тех ссылок там нет. :(

Что делать то? отключать редирект с http? но тогда как людей на https переводить? Или избавлятся от 404х страниц своих? 😡

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий