Караул! Боты сожрали 90 гигов трафика

12
A
На сайте с 05.07.2006
Offline
125
#11

Нет, реально страниц намного меньше. Думаю, порядка 10.000. Они все создаются динамически, урлы "очеловеченные", типа - http://shashki.com/article1697.html

Нашел вот такую статистику на хостинге -

Hits by Response Code

Code 200 - OK 349538

Code 206 - Partial Content 2141

Code 301 - Moved Permanently 322

Code 302 - Found 84165

Code 304 - Not Modified 130443

Code 403 - Forbidden 18

Code 404 - Not Found 7968

Code 405 - Method Not Allowed 2

Code 406 - Not Acceptable 37

Code 416 - Requested Range Not Satisfiable 17

А есть ли возможность указывать боту просматривать только НОВЫЕ страницы ?

Все про шашки (http://www.shashki.com)
I
На сайте с 29.04.2007
Offline
29
#12
Alkand:
А есть ли возможность указывать боту просматривать только НОВЫЕ страницы ?

Если у Вас стоит CMS и названия материала с ссылками можно вытащить из базы, то может быть имеет смысл составить xml карту сайта с новыми(определять по времени создание документа) урлами. т.е. поставить везде NOFOLLOW и вручную ему скармливать ссылки через карту сайта.

K
На сайте с 31.01.2001
Offline
737
#13
Alkand:
А есть ли возможность указывать боту просматривать только НОВЫЕ страницы ?

Попробуйте использовать заголовок If-Modified-Since.

Проверять, как это работает, можно тут: http://seolab.ru/add/header.htm

Пока все время выдает 200, а не 304.

Alkand:
реально страниц намного меньше. Думаю, порядка 10.000.

Еще обратите внимание, что в базе сайт с www, причем 63000 страниц.

Роботов типа WebAlta, MSN я бы пока закрыл. Заходов они не дадут, а трафик сожрут.

404 вроде выдает правильно. Только не видно сообщения об ошибке, но поисковикам это пофиг.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
T
На сайте с 11.08.2005
Offline
181
#14
idweb:
т.е. поставить везде NOFOLLOW и вручную ему скармливать ссылки через карту сайта.

<a href="" rel="NOFOLLOW"> Яндексом не обрабатывается (эта конструкция, прежде всего для Google). А в данном случае именно боты Яндекс наиболее активные.

Кроме того, я ведь написал в первом посте о правильной обработке If-Modified-Since. Это может быть хорошим решением Вашего вопроса.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий