Яндекс постоянно добавляет несуществующие страницы 404 в индекс. Как это?

123
Станислав Романенко
На сайте с 05.09.2007
Offline
325
#11

Просканируйте через Screaming Frog все страницы по маске /forum и потом посмотрите список 404 страниц на предмет входящих ссылок (внизу вкладка Inlinks).

Сайт не лезет в топ? Сделаю аудит без воды всего за 8000 рублей! Отзывы клиентов тут (https://searchengines.guru/ru/forum/939454), почта для связи: ingref@ya.ru Посмотрю, в чём проблема с вашим сайтом, за 100 рублей (https://searchengines.guru/ru/forum/comment/15662080).
bezmazbl
На сайте с 23.08.2017
Offline
24
#12

Отстутствует canonical на пагинации.

От этого куча дублей по Тайтлам и остальной мете.

▁ ▂ ▃ ▅ ▆ █ (https://www.mixcloud.com/bezmazbl/)
Vladimir
На сайте с 07.06.2004
Offline
586
#13
Bengurion:
Благодарю!
Вот прогнал https через все роботы все одно и тоже показали. Вот.


Но если проверять http то тут конечно 301, но так и было задумано и это рекомендует яндекс при переезде на https. Проверил ни один робот 200 не показывет.

- про http и 301, оставьте, все верно настроено, все верно яша получает 301

- все, что советуют какие то сервисы, бред, ну найдете вы их там, и что? Это вам не поможет.

Исходим их того, что Яша страницу индексирует, значит в какой то момент времени или какой то робот получает 200, вместо 404

Исходим их того, что никакие входящие ссылки не заставят Яшу проиндексировать, если там 404

Искать только на своем сервере, его ответы. Иммитировать Яшу.

- про рабочую версию сайта https. Генерируем в голове новую нерабочую ссылку и проверяем на первом роботе, новую ссылку на втором и тд. Если все роботы на все сылки отдают 404. Проверяем последнюю проиндексированную ссылку всеми роботами и пишем вопрос в поддержку....с вопросом как так? вероятность 1 из ста...но вдруг ответят дельно)

Аэройога ( https://vk.com/aeroyogadom ) Йога в гамаках ( https://vk.com/aero_yoga ) Аэройога обучение ( https://aeroyoga.ru ) и просто фото ( https://weandworld.com )
A
На сайте с 23.06.2009
Offline
171
#14

У меня это постоянная история

Например, Яндекс берет реальную страницу, отрезает часть Урл, в таком виде индексирует, а потом удаляет из индекса как 404. Ну да, такой страницы никогда и не было ведь на сайте

Или добавляет к настоящему адресу точку или другой символ - индексирует и удаляет.

Настоящие страницы с настоящими адресами живут своей жизнью из индекса не выпадают. Все происходит параллельно

Vladimir
На сайте с 07.06.2004
Offline
586
#15
Anzey:
У меня это постоянная история
Все происходит параллельно

Это, говорит лишь о том, что вы понятия не имеете, что у вас происходит на сайте

Т.е, если кому то вздумается наплодить на ваш сайт N-k ссылок с точками/символами ( а такое бывает ), то ваш сайт вылетит из индекса

B
На сайте с 23.10.2008
Offline
82
#16
Ingref:
Просканируйте через Screaming Frog все страницы по маске /forum и потом посмотрите список 404 страниц на предмет входящих ссылок (внизу вкладка Inlinks).

Там ссылки теперь нет, предлагают подписатся на сервис.

Да и я уверен нигде и никогда не было ссылок на несуществующие страницы. Даже если по всем поисковикам пробить нет таких совпадений.

🚬

---------- Добавлено 27.09.2019 в 18:31 ----------

bezmazbl:
Отстутствует canonical на пагинации.
От этого куча дублей по Тайтлам и остальной мете.

Совершенно верно кстати, под каждой добавленной строчкой с несуществующей страницей в яндексе вижу.

Канонический адрес не указан...

Да и в существующих страницах пагинации нет каноникал. Только в темах.

Просветите как отсутствующий канонический адрес на пагинации генерит несуществующие страницы? И как изменится этот процесс если добавить канонические пагинации? Склоняюсь к тому чтобы отрубить 404е страницы и сделать их стандартными :(

Vladimir
На сайте с 07.06.2004
Offline
586
#17
Bengurion:

Просветите как отсутствующий канонический адрес на пагинации генерит несуществующие страницы? И как изменится этот процесс если добавить канонические пагинации? Склоняюсь к тому чтобы отрубить 404е страницы и сделать их стандартными :(

ВЫ, что бред читаете?

Несуществующие страницы генерит движок, отдавая 200 в какой то момент. Это вам и надо найти.

Самый писк, поиск неисправности, которая существует...но ее не видно

канонический адрес, вообще забудьте, что это такое...было и перестало существовать

На своих сайтах, сроду этого бреда не было. Ибо, дублей страниц, просто не должно быть на сайте

B
На сайте с 23.10.2008
Offline
82
#18

В общем коллеги по всем приборам от яндекса если проверить страницу прямо сейчас со всех ботов выглядит как 404 (см картинки выше).

Но если смотришь инфо о странице в Индексировании/Страницы в поиске

То выглядит вот так - 200 ок

На всякий случай добавил в заголовок 404й страницы.

<meta name="robots" content="noindex, nofollow"/>

Поможет? Узнаем через неск дней когда в "Страницы в поиске" попадет набор ссылок за сегодня.

gif 0111111.gif
Станислав Романенко
На сайте с 05.09.2007
Offline
325
#19

Bengurion, посмотрите по логам сервера, когда бот Яндекса к этому урлу обращается, ему какой ответ выдаётся? Если 404, то можно Платону написать, может чего подскажет.

B
На сайте с 27.05.2018
Offline
130
#20
Vladimir #:

Это, говорит лишь о том, что вы понятия не имеете, что у вас происходит на сайте

Т.е, если кому то вздумается наплодить на ваш сайт N-k ссылок с точками/символами ( а такое бывает ), то ваш сайт вылетит из индекса

Бред полный

123

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий