Аномальное поведение google бота

12
K
На сайте с 14.01.2025
Offline
16
2220

Здравствуйте, у меня на сайте раньше, до того как на страницу с фильтрами я поставил "noindex, nofollow", данные страницы были просто заблокированы в robots.txt. Но они иногда всё же вылетали в индекс, хотя были заблокированы. Потом я добавил данные теги, но в SC у меня в разделе "Обнаружено, но не проиндексировано" было очень много страниц с фильтрами.

Чтобы Googlebot мог понять, что там стоит noindex, нужно было убрать правило из robots.txt. Ну, я и убрал. Вроде бы они убрались из индекса (их было пару штук, но меня бесило то, что Googlebot по ним бегал, хотя в этом не было необходимости).

В итоге сейчас он начал каждую минуту бегать по этим фильтрам, хотя такого раньше не было. Я запрашивал проверку в SC в пункте "Страница просканирована, но пока не проиндексирована". Она прошла ещё 28.01.2025, но страницы из данного пункта так и не убрались.

С чем связано такое поведение Googlebot? Почему он начал сканировать все фильтры, чтобы убрать их из раздела "Страница просканирована, но пока не проиндексирована"?

Извините, если плохо описал, я старался как мог.

L
На сайте с 10.02.2015
Offline
260
#1
А комбинации фильтров генерируют ссылки?
Если там пару страниц, то забейте.
K
На сайте с 14.01.2025
Offline
16
#2
livetv #:
А комбинации фильтров генерируют ссылки?
Если там пару страниц, то забейте.

комбинации генерируют ссылки. И страниц не пару. Но как мне кажется он просто проверяет на всех ли страницах стоит "noindex, nofollow"

minsky
На сайте с 01.09.2012
Offline
219
#3
А в чем вообще проблема? Googlebot как хочет, так и бегает. Ни какие теги и запреты ему ни по чем))))
Продвигаю сайты ссылками, ускоряю индексацию сайтов и отдельных страниц ( https://kwork.ru/user/minsky?ref=23382 )
K
На сайте с 14.01.2025
Offline
16
#4
minsky #:
А в чем вообще проблема? Googlebot как хочет, так и бегает. Ни какие теги и запреты ему ни по чем))))

проблема в том что он резко побежал. И вопрос почему? При чем он бежит по ним с какой то нереальной скоростью

L
На сайте с 10.02.2015
Offline
260
#5
Kuala #:

комбинации генерируют ссылки.

Хотя новые страницы по идее посещать не должен, раз там nofollow.

Есть 2 проблемы:
1) google не берет страницы в индекс
2) google не выбрасывает страницы из индекса (ошибок)

K
На сайте с 14.01.2025
Offline
16
#6
livetv #:

Хотя новые страницы по идее посещать не должен, раз там nofollow.

Есть 2 проблемы:
1) google не берет страницы в индекс
2) google не выбрасывает страницы из индекса (ошибок)

у меня есть эти страницы уже просканеные(какая то часть). В SC отображается они в пункте "Страница просканирована, но пока не проиндексирована". И он наверное побежал по ним что проверить тег и убрать их в категорию "Запрещено тегом noindex"

Vladimir
На сайте с 07.06.2004
Offline
614
#7
Kuala #:

проблема в том что он резко побежал. И вопрос почему? При чем он бежит по ним с какой то нереальной скоростью

Так тормозни бота, чтобы не бегал по 10 раз
Аэройога ( https://vk.com/aeroyogadom ) Йога в гамаках ( https://vk.com/aero_yoga ) Аэройога обучение ( https://aeroyoga.ru ) и просто фото ( https://weandworld.com )
L
На сайте с 10.02.2015
Offline
260
#8
Kuala #:

у меня есть эти страницы уже просканеные(какая то часть). В SC отображается они в пункте "Страница просканирована, но пока не проиндексирована". И он наверное побежал по ним что проверить тег и убрать их в категорию "Запрещено тегом noindex"

Зачем 2 разка сканировать? Он что первый раз после разблокировки в robots.txt не увидел?
Проверьте, что он формируется.

minsky
На сайте с 01.09.2012
Offline
219
#9
Kuala #:

проблема в том что он резко побежал. И вопрос почему? При чем он бежит по ним с какой то нереальной скоростью

Нереальная скорость - это как? Если раз в секунду, то это вполне нормально и допустимо. Ну судя по графику, что тут с нереальной скоростью?
K
На сайте с 14.01.2025
Offline
16
#10
livetv #:

Зачем 2 разка сканировать? Он что первый раз после разблокировки в robots.txt не увидел?
Проверьте, что он формируется.

когда блокал через robots.txt он иногда все равно закидывал их в  индекс. "Проиндексирована не смотря на блокировку в robots.txt". А не видит noindex Тег. Потому что страницу не может просканировать. Бред получается

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий