На днях сотрудник Google Гэри Илш объяснил подробнее, что означает статус «Страница проиндексирована без контента» в отчете об индексировании в Search Console. По его словам, в большинстве случаев это связано с блокировкой страницы в robots.txt.
- Вопрос
Илша спросили, может ли такая ошибка возникать в результате длительного времени загрузки или таймаутов. При этом автор вопроса приложил скриншот с описанием этого статуса из Справки, где говорится, что он не связан с robots.txt:
«Страница есть в индексе Google, но поисковый робот не смог обработать ее содержание. Возможно, она замаскирована от Google или создана в неиндексируемом формате. Это не имеет отношения к блокировке доступа с помощью файла robots.txt».
- Ответ
Илш ответил, что в описанных случаях более вероятна ошибка soft 404.
Что касается статуса «Страница проиндексирована без контента», то он предназначен для тех страниц, которые заблокированы в robots.txt.
no, we would likely just not used those pages of they time out. maybe we'd report them as soft404, depending on whether they time out for Googlebot or rendering.
— Gary 鯨理/경리 Illyes (@methode) 20 марта 2021 г.
this error is really just for pages that are blocked by robots.txt
Он также добавил, что это отличный вопрос.