Аномальное поведение google бота

17

Kuala

23 февраля 2025, 12:00

2239

Здравствуйте, у меня на сайте раньше, до того как на страницу с фильтрами я поставил "noindex, nofollow", данные страницы были просто заблокированы в robots.txt. Но они иногда всё же вылетали в индекс, хотя были заблокированы. Потом я добавил данные теги, но в SC у меня в разделе "Обнаружено, но не проиндексировано" было очень много страниц с фильтрами.

Чтобы Googlebot мог понять, что там стоит noindex, нужно было убрать правило из robots.txt. Ну, я и убрал. Вроде бы они убрались из индекса (их было пару штук, но меня бесило то, что Googlebot по ним бегал, хотя в этом не было необходимости).

В итоге сейчас он начал каждую минуту бегать по этим фильтрам, хотя такого раньше не было. Я запрашивал проверку в SC в пункте "Страница просканирована, но пока не проиндексирована". Она прошла ещё 28.01.2025, но страницы из данного пункта так и не убрались.

С чем связано такое поведение Googlebot? Почему он начал сканировать все фильтры, чтобы убрать их из раздела "Страница просканирована, но пока не проиндексирована"?

Извините, если плохо описал, я старался как мог.

L

266

livetv

23 февраля 2025, 12:12

#1

А комбинации фильтров генерируют ссылки?
Если там пару страниц, то забейте.

K

17

Kuala

23 февраля 2025, 12:13

#2

livetv #:
А комбинации фильтров генерируют ссылки?
Если там пару страниц, то забейте.

комбинации генерируют ссылки. И страниц не пару. Но как мне кажется он просто проверяет на всех ли страницах стоит "noindex, nofollow"

229

minsky

23 февраля 2025, 12:15

#3

А в чем вообще проблема? Googlebot как хочет, так и бегает. Ни какие теги и запреты ему ни по чем))))

Продвигаю сайты ссылками, ускоряю индексацию сайтов и отдельных страниц ( https://kwork.ru/user/minsky)

K

17

Kuala

23 февраля 2025, 12:16

#4

minsky #:
А в чем вообще проблема? Googlebot как хочет, так и бегает. Ни какие теги и запреты ему ни по чем))))

проблема в том что он резко побежал. И вопрос почему? При чем он бежит по ним с какой то нереальной скоростью

L

266

livetv

23 февраля 2025, 12:16

#5

Kuala #:

комбинации генерируют ссылки.

Хотя новые страницы по идее посещать не должен, раз там nofollow.

Есть 2 проблемы:
1) google не берет страницы в индекс
2) google не выбрасывает страницы из индекса (ошибок)

K

17

Kuala

23 февраля 2025, 12:18

#6

livetv #:

Хотя новые страницы по идее посещать не должен, раз там nofollow.

Есть 2 проблемы:
1) google не берет страницы в индекс
2) google не выбрасывает страницы из индекса (ошибок)

у меня есть эти страницы уже просканеные(какая то часть). В SC отображается они в пункте "Страница просканирована, но пока не проиндексирована". И он наверное побежал по ним что проверить тег и убрать их в категорию "Запрещено тегом noindex"

Проиндексировано, несмотря на блокировку Множество внутренних ссылок на Страница просканирована, но пока

626

Vladimir

23 февраля 2025, 15:50

#7

Kuala #:

проблема в том что он резко побежал. И вопрос почему? При чем он бежит по ним с какой то нереальной скоростью

Так тормозни бота, чтобы не бегал по 10 раз

Аэройога ( https://vk.com/aeroyogadom ) Йога в гамаках ( https://vk.com/aero_yoga ) Аэройога обучение ( https://aeroyoga.ru ) и просто фото ( https://weandworld.com )

L

266

livetv

23 февраля 2025, 15:56

#8

Kuala #:

у меня есть эти страницы уже просканеные(какая то часть). В SC отображается они в пункте "Страница просканирована, но пока не проиндексирована". И он наверное побежал по ним что проверить тег и убрать их в категорию "Запрещено тегом noindex"

Зачем 2 разка сканировать? Он что первый раз после разблокировки в robots.txt не увидел?
Проверьте, что он формируется.

229

minsky

23 февраля 2025, 16:07

#9

Kuala #:

проблема в том что он резко побежал. И вопрос почему? При чем он бежит по ним с какой то нереальной скоростью

Нереальная скорость - это как? Если раз в секунду, то это вполне нормально и допустимо. Ну судя по графику, что тут с нереальной скоростью?

K

17

Kuala

23 февраля 2025, 16:15

#10

livetv #:

Зачем 2 разка сканировать? Он что первый раз после разблокировки в robots.txt не увидел?
Проверьте, что он формируется.

когда блокал через robots.txt он иногда все равно закидывал их в индекс. "Проиндексирована не смотря на блокировку в robots.txt". А не видит noindex Тег. Потому что страницу не может просканировать. Бред получается

VK приобрела 70% в структуре компании-разработчика red_mad_robot

Что делать, если ваша email-рассылка попала в спам