Как успокоить гуглебота?

GAMMA
На сайте с 27.12.2006
Offline
154
540

Проблема такая - есть сайт который почему то очень активно сканирует гуглебот, и соответственно грузит мой аккаунт вероятно. Хостер присылает отчёты по нагрузке каждый вечер, и там мрак! Для выяснения причин включил из ПУ аккаунта скрипт статистики Awstats и вижу что в принципе весь основной трафф идёт от гуглебота. Например за 1 и 2 марта уникальных посетилей было 707, визитов 900, количество просмотренных страниц 3802, хиты 25282, трафик 167 мегабайт. И за это же время Гугл имел 12890 хитов и трафф 522 мегабайта. В инструментах вебмастера статистика показывает почему то намного меньший трафик - среднее количество страниц в день 330, трафф 3.5 метра. Врёт статистика или кто то маскируется под бота гугля? И как уменьшить нагрузку до приемлиемого уровня?

Мой сервис блогов (http://mublog.ru) и личный блог (http://blogroot.ru)
xant
На сайте с 17.12.2008
Offline
65
#1

Crawl-delay в robots.txt

PS. может кто-то просто вас парсит?

Эксклюзивные сайты и веб-2.0 приложения под ключ. Дорого.
GAMMA
На сайте с 27.12.2006
Offline
154
#2

Crawl-delay в robots.txt поставил давно. Пауза в 5 секунд. Но почему то в инструментах вебмастера Гугл на эту команду ругается - пишет что не принимает этот стандарт.

По поводу парсинга - как его вычислить? У меня в логах иногда показывало что заходит граббер, но это бывает редко. Может кто то научился маскировать под Гугл грабберы?

BotaniQ
На сайте с 30.07.2007
Offline
152
#3

Как вариант:

Инструменты для веб-мастеров > Настройки > Частота сканирования > Задать пользовательскую скорость сканирования

База данных почтовых индексов Великобритании (UK Postcode database) (/ru/forum/319540)
SM
На сайте с 01.02.2008
Offline
17
#4

GAMMA, посмотрите ипы, с которых ходит "гуглбот" ;)

GAMMA
На сайте с 27.12.2006
Offline
154
#5

Смотрел там, там скорость как раз при которой максимум страниц 300 в сутки можно просканировать. Что то просто никак не сходится - настройки и статистика с реальными данными которые берутся из логов обращений к серверу.

GAMMA добавил 03.03.2009 в 00:32

sergey.m:
GAMMA, посмотрите ипы, с которых ходит "гуглбот" ;)

Тоже совпадает с их заявленными для ботов IP, их там несколько.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий