бот яндекса понимает gzip или deflate?

12 3
OZE
На сайте с 21.05.2006
Offline
152
OZE
2125

...есть мысль отдавать ему контент сжатым

последнее время бот яши стал очень прожорливым, если так дальше пойдет, то исчерпаю лимит трафика

кто-нибудь что-то знает по сабжу?

ЗЫ: ну и другие боты тоже интересуют, особенно гугл

bbon
На сайте с 01.04.2006
Offline
127
#1

все поисковики понимают.. теоретически, но яндекс забирает странички несжатыми(сейчас глянул)

V
На сайте с 22.02.2007
Offline
150
#2

Надо смотреть все заголовки запроса робота к серверу, обычно в запросе есть хеадер, который говорит, что клиент понимает сжатие. Если его нет, тогда не понимает.

Помоему что-то вида

Accept-encoding: gzip

Zlo_606ep
На сайте с 14.12.2006
Offline
129
#3

Уж лучше для экономии трафика выдавать заголовки last-modified и отвечать 304 ответом на last-modified запрос ботов, чтобы отучить их от лишних запросов закешированных ими страниц

Dwarf
На сайте с 06.10.2004
Offline
60
#4
OZE:
...есть мысль отдавать ему контент сжатым

последнее время бот яши стал очень прожорливым, если так дальше пойдет, то исчерпаю лимит трафика

кто-нибудь что-то знает по сабжу?

ЗЫ: ну и другие боты тоже интересуют, особенно гугл

Vimsite слушайте - он дело говорит. Какая вам разница, бот или бродилка? Если говорит, что акцептует gzip, то и отдавайте gzip. У бота яндекса этого хедера нет, а вот у гугла есть.

Accept: */*

Connection: Keep-alive
Host: www.xxxxx.ru
User-Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Accept-Encoding: gzip
From: googlebot(at)googlebot.com

Accept: text/html, application/pdf;q=0.1, application/rtf;q=0.1, text/rtf;q=0.1, application/msword;q=0.1, application/x-shockwave-flash;q=0.1, application/vnd.ms-excel;q=0.1, application/vnd.ms-powerpoint;q=0.1

Accept-Language: ru, uk, be, en, *;q=0.01
Connection: Keep-Alive
Host: xxxxx.ru
User-Agent: Yandex/1.01.001 (compatible; Win16; I)
From: webadmin@yandex.ru
Деревянные окна (http://www.wood-win.ru/)
V
На сайте с 22.02.2007
Offline
150
#5

Кстати, если сделать чтобы зипованные страницы отдавались не только роботам, а вообще всем посетителям, чьи клиенты понимают сжатие, плюс сделаете как говорит Zlo_606ep, то экономия траффика будет неплохой.

Чем люди хуже роботов, им тоже надо траффик экономить, да и страница быстрее загрузится :)

OZE
На сайте с 21.05.2006
Offline
152
OZE
#6

всем спасибо за ответы,

яндекс как обычно - полное фи:)

хотя бы на боте гугла сэкономить - уже хорошо

по статистике у меня 90% - это IE, у IE по умолчанию передается заголовок Accept-Encoding: gzip, deflate , т.е. ослик понимает оба вида сжатия, так что в общей массе клиенты не будут жрать много трафа

ЗЫ: а идея с 304 интересная, надо будет ее обдумать.

Zlo_606ep
На сайте с 14.12.2006
Offline
129
#7

Идея с 304 ответом: вставить в начале файла (шаблона сайта), при условии, что есть страницы, которые не обновляются, и у которых можно указать дату создания (или одной переменной указать дату последнего обновления всего сайта):

$d=дата обновления сайта / страницы (например 2007-01-01 12:00:00)

$lm=gmdate('D, d M Y H:i:s',$d).' GMT';

if(isset($_SERVER['HTTP_IF_MODIFIED_SINCE']))

{

$ims=preg_replace('/;.*$/', '', $_SERVER['HTTP_IF_MODIFIED_SINCE']);

if($ims==$lm)

{

header('HTTP/1.0 304 Not Modified');

exit;

}

}

header('Last-Modified: '. $lm);

T.R.O.N
На сайте с 18.05.2004
Offline
314
#8
OZE:
последнее время бот яши стал очень прожорливым, если так дальше пойдет, то исчерпаю лимит трафика
кто-нибудь что-то знает по сабжу?

Конечно бот понимает сжатие (с яшей непонятки.). Естественно можно все сжимать, если рессурс машины мение ценен чем трафф. Да и выигрыш, не настолько велик, как если выдавать 304 ошибку.

PS что это за хостер такой, который считает исходящий российский траф. Это почти прошлый век.

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
Rimlyanin
На сайте с 22.02.2006
Offline
200
#9
T.R.O.N:
Конечно бот понимает сжатие. Естественно можно все сжимать, если рессурс машины мение ценен чем трафф. Да и выигрыш, не настолько велик, как если выдавать 304 ошибку.

PS что это за хостер такой, который считает исходящий российский траф. Это почти прошлый век.

На данный момент бот яши не понимает gzip и просит в хедерах не сжатый контент, если на его запрос несжатого контента отдать ему зипованный то не удивляйтесь потом выпадению из серпа...

OZE
На сайте с 21.05.2006
Offline
152
OZE
#10
T.R.O.N:

PS что это за хостер такой, который считает исходящий российский траф. Это почти прошлый век.

это не хостер, а дедик в америке

там ограничение на 1Т любого трафа в месяц - первый Т бесплатно, а за превышение надо уже платить.

примерно прикинул, с учетом текущего трафа получилось, что надо будет переплатить около 500 баксов, хотя за сам сервер с кучей всяких фич я отдаю всего 154 в месяц

вот и озадачился😕

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий