Yandex bot сходит с ума

12
M2
На сайте с 18.05.2017
Offline
4
2842

Добрый день ! У Меня такая ситуация , на сайте с базой данных на 200 mb (4 000 страниц) сайту больше года и все страницы есть в индексе. Вопрос такой - Yandex bot КАЖДЫЙ ДЕНЬ скачивает по 8-9 гигов .... Это нормальное явление ?

Вот скрин из awstats

Оптимизайка
На сайте с 11.03.2012
Offline
396
#1

А это точно яндекс ;) IP проверяли?

⭐ BotGuard (https://botguard.net) ⭐ — защита вашего сайта от вредоносных ботов, воровства контента, клонирования, спама и хакерских атак!
M2
На сайте с 18.05.2017
Offline
4
#2
Оптимизайка:
А это точно яндекс ;) IP проверяли?

А какой IP у яндекса ?

в логах вот так

Mozilla/5.0 (compatible; YandexBot/3.0; +http:// yandex.com/bots)"

Оптимизайка
На сайте с 11.03.2012
Offline
396
#3

У яндекса несколько подсетей, смотрите с каких IP обращались, проверяйте по whois. Парсеры часто маскируются под поисковых ботов, User Agent можно передать-то любой.

M2
На сайте с 18.05.2017
Offline
4
#4
Оптимизайка:
У яндекса несколько подсетей, смотрите с каких IP обращались, проверяйте по whois. Парсеры часто маскируются под поисковых ботов, User Agent можно передать-то любой.

Проверил выборочно вот результат

Оптимизайка
На сайте с 11.03.2012
Offline
396
#5

Похож на настоящий :)

Сайт кстати не взламывали у вас? А то может настоящий нашел кучу "левых" страниц и усердно их индексирует, по логам посмотрите к каким страницам идет обращение, они должны существовать вообще?

M2
На сайте с 18.05.2017
Offline
4
#6
Оптимизайка:
Похож на настоящий :)

Сайт кстати не взламывали у вас? А то может настоящий нашел кучу "левых" страниц и усердно их индексирует, по логам посмотрите к каким страницам идет обращение, они должны существовать вообще?

Нет сайт не ломали .

По логам к правильным адресам ведёт !!!

Оптимизайка
На сайте с 11.03.2012
Offline
396
#7

maks2015, ну тогда значит скоро апдейт :)

M2
На сайте с 18.05.2017
Offline
4
#8
Оптимизайка:
maks2015, ну тогда значит скоро апдейт :)

🍿🍿🍿:)

Mik Foxi
На сайте с 02.03.2011
Offline
1076
#9

Crawl-delay: 5

помогает.

Антибот, антиспам, веб файрвол, защита от накрутки поведенческих: https://antibot.cloud/ + партнерка, до 40$ с продажи.
M2
На сайте с 18.05.2017
Offline
4
#10
foxi:
Crawl-delay: 5
помогает.

Я уже думал про ограничения . но пока сервак не сильно грузит , ток что подожду может это временно и яндекс одумается !

Мне просто интересно почему идёт такое жёсткое сканирование сайта ?

А может это от того что я прописал микроразметку на сайте около месяца назад ??? Вот яндекс и пересканирует таким образом !

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий