Я вам неслучайно ответил про старые 404 адреса, которые актуальны сейчас на сайте, и те адреса, которые учёл робот, но они могут быть уже недоступны через сайт.
То, что робот уже учёл и будет продолжать по ним ходить указывая на отсутствующие страницы - эту информацию никак нельзя достать - это информация на стороне Яндекса, к ней нет доступа.
А вот то, что вы сейчас можете достать парсерами 404 страницы - это тот актуальный перечень который вам доступен - с ним и работайте.
Но! Дело ещё и в том, что перечень 404 страниц вы можете получить парсером, но в остальном это неполная картина, потому что сигналы для старых адресов могут быть и XML карте, и у внешних ссылок, и в PDF документах, так что такая чехарда может длиться долгими месяцами. И Вебмастер может бесконечно сыпать и сыпать ошибками.
Иногда полезно вообще сбросить индексацию и начать рабочие итерации заново (но метод кардинальный и подходит далеко не всем, ввиду необходимости живого поискового трафика и т.д.)
Многократно. Потому что заказчики сначала делают большие и многотоварные сайты, потом начинают свободно что-то менять и там накапливаются такие ссылочные, структурные перекосы и по релевантности в том числе, что сайт падает и тогда заказчики начинают вспоминать про SEО-шников, которые потом всё это должны месяцами выгребать.
А заказчики требуют срочно решить задачу до следующей недели.. на эту тему у меня уже 33 проплешины :)
Если вы так формулируете вопрос, то просто ждите наступления момента, когда сайт вообще перестанет реагировать на ваши манипуляции и резко потеряет видимость.
Проверяйте донорские страницы. Нет ли там следов спама, нет ли признаков дополнительной продажи ссылок с данных страниц (новые/дополнительные рекламные блоки c прямыми ссылками, спрятанные ссылки и т.д.)
Если страницы выпали из индекса, значит качественные кондиции донорских страниц вероятно ухудшились и здесь надо разбираться с ситуацией обстоятельно.
Решать помимо анализа текущего состояния самих страниц - доп. укреплять ссылочным, бот. трафиком, но если донорский сайт вообще массово теряет страницы в индексе, то вышеуказанные меры могут быть бесполезны.
Уверяю, тот же. Если это произошло с карточкой, то карточка физически по URL-у будет находиться на другом адресе, а по прежнему адресу робот будет получать 404 (если редирект не настроен), вот и получится, что тоже само содержимое карточки будет обнаружено по новому адресу (и сначала будет указано, что это дубль - и не факт, что войдет в индекс), а по старому адресу страница вылетит из индекса из-за 404-ой ошибки.
Это довольно распространённая ситуация.
Обычная, когда реализано ЧПУ и алиас в URL-е свободно изменяется. После рабочей генерации он должен быть зафиксирован, потому что переименование страницы соответственно даёт изменение URL-а.
Уверен, дело в TC, у которого,
Очевидно, там чехарда со сменой алиаса в URL-е.
Важный момент. Есть перечень битых ссылок, который определил Яндекс и будет по ним ходить ещё несколько месяцев, а есть перечень фактических битых ссылок, которые можно найти на текущем сайте.
Так вот. Первое узнать невозможно, это данные на стороне Яндекса и это закрытая информация.
Второе - краулинговой программой / сервисов.
Программа - здесь.
Сервис - здесь.
Откуда вы знаете, что скоро? :) Может вам ещё столько же отмерено? :)
Странно, мне всегда казалось иначе :)
Жизнь и смерть - это одно и то же.
Давно известная аксиома.
Готовы легко поменять первое на второе?
Отвечают как правило в течение нескольких дней. Бывает, чаще.