BingBot получает ошибку 404 при существующей странице

1 23
IL
На сайте с 20.04.2007
Offline
435
#21
Iggo:
Для www.reg1.site.ru четко прописана секция в httpd.conf, но понятно, что он туда не попадает.

А можно эту секцию увидеть?

В смысле, поддомен www для поддомена reg1 точно прописан?

Если ручками зайти на www.reg1 - что выведет? А то в примерах Ваших поддомен третьего уровня, а у bing-а - четвёртого..

Host: zzz.site.ru
... :) Облачные серверы от RegRu - промокод 3F85-3D10-806D-7224 ( http://levik.info/regru )
I
На сайте с 04.06.2010
Offline
81
#22
ivan-lev:
А можно эту секцию увидеть?
В смысле, поддомен www для поддомена reg1 точно прописан?
Если ручками зайти на www.reg1 - что выведет? А то в примерах Ваших поддомен третьего уровня, а у bing-а - четвёртого..

Вот кусок:

<VirtualHost reg1.site.ru>
ServerAdmin admin@site.ru
DocumentRoot c:/www/allregion
ServerName reg1.site.ru
ErrorLog logs/localhost_error.log
CustomLog logs/localhost_access.log combined
ErrorDocument 404 /404.php
</VirtualHost>
<VirtualHost www.reg1.site.ru>
ServerAdmin admin@site.ru
DocumentRoot c:/www/allregion
ServerName www.reg1.site.ru
ErrorLog logs/localhost_error.log
CustomLog logs/localhost_access.log combined
ErrorDocument 404 /404.php
</VirtualHost>

В логах localhost_access.log вижу как удачные заходы на страницы reg1 (код 200), так и "неудачные" (код 404 или свеже прописанный код 301) от одного и того же бота BingBot

Понятно, что вопрос в неправильной реакции Апача - вопрос в том, где именно сбоит...

Раньше грешил на то, что BingBot пробивает сервер "корявыми" заголовками намеренно - сейчас думаю, что это вряд ли, т.к. ошибки зафиксированы в вебмастере бинга...

Всё, что не убивает, делает Вас сильнее (c) Платон Щукин
IL
На сайте с 20.04.2007
Offline
435
#23

Пишите в лог (перед 404/301) var_dump($_SERVER); var_dump($_GET); для "непонятных" ситуаций. Посмотрим, что там.

С поддоменами www.reg3 и www.reg4 такая же ситуация? Вроде они получали 404.. а с reg1 всё работало?

p.s. ИМХО, уместно использовать ServerAlias

I
На сайте с 04.06.2010
Offline
81
#24

Недоделанное мучит...

Поставил на некоторое время логирование заголовков от "удачно отработанных" запросов и вот первые результаты!!!

1. В ошибках:

--- 2013-10-04 01:24:58
Cache-Control: no-cache
Connection: Keep-Alive
Pragma: no-cache
Accept: */*
Accept-Encoding:
From: bingbot(at)microsoft.com
Host: www.reg1.site.ru
User-Agent: Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)

2. Без ошибок:

--- 2013-10-08 14:48:56
Cache-Control: no-cache
Connection: Keep-Alive
Pragma: no-cache
Accept: */*
Accept-Encoding: gzip, deflate
From: bingbot(at)microsoft.com
Host: www.reg1.site.ru
User-Agent: Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)

Как видно - ошибочно разбирается запрос с пустым значением Accept-Encoding. Сходу не скажете - встречаться доводилось?

---------- Добавлено 08.10.2013 в 15:38 ----------

ivan-lev:
Пишите в лог (перед 404/301) var_dump($_SERVER); var_dump($_GET); для "непонятных" ситуаций. Посмотрим, что там.
С поддоменами www.reg3 и www.reg4 такая же ситуация? Вроде они получали 404.. а с reg1 всё работало?
p.s. ИМХО, уместно использовать ServerAlias

ivan-lev, такая ситуация со всеми существующими поддоменами reg1, reg2, ... regN

В

ыше написал о Accept-Encoding.

I
На сайте с 04.06.2010
Offline
81
#25

ivan-lev, вот нашел на просторах рекомендацию по обработке gzip в conf:

# ----------------------------------------------------------------------

# Gzip сжатие

# ----------------------------------------------------------------------

<IfModule mod_deflate.c>

# Включаем deflate для не стандартных заголовков:

# http://developer.yahoo.com/blogs/ydn/posts/2010/12/pushing-beyond-gzipping/

<IfModule mod_setenvif.c>

<IfModule mod_headers.c>

SetEnvIfNoCase ^(Accept-EncodXng|X-cept-Encoding|X{15}|~{15}|-{15})$ ^((gzip|deflate)\s*,?\s*)+|[X~-]{4,13}$ HAVE_Accept-Encoding

RequestHeader append Accept-Encoding "gzip,deflate" env=HAVE_Accept-Encoding

</IfModule>

</IfModule>

<IfModule mod_filter.c>

AddOutputFilterByType DEFLATE text/html text/plain text/css \

application/json text/javascript application/javascript application/x-javascript text/x-js text/ecmascript application/ecmascript text/vbscript text/fluffscript \

text/xml application/xml text/x-component \

application/xhtml+xml application/rss+xml application/atom+xml \

image/x-icon image/svg+xml application/vnd.ms-fontobject application/x-font-ttf font/opentype

</IfModule>

</IfModule>

Что думаете - поможет?

I
На сайте с 04.06.2010
Offline
81
#26

ivan-lev, вот нашел на просторах рекомендацию по обработке gzip в conf:

# ----------------------------------------------------------------------

# Gzip сжатие

# ----------------------------------------------------------------------

<IfModule mod_deflate.c>

# Включаем deflate для не стандартных заголовков:

# http://developer.yahoo.com/blogs/ydn...yond-gzipping/

<IfModule mod_setenvif.c>

<IfModule mod_headers.c>

SetEnvIfNoCase ^(Accept-EncodXng|X-cept-Encoding|X{15}|~{15}|-{15})$ ^((gzip|deflate)\s*,?\s*)+|[X~-]{4,13}$ HAVE_Accept-Encoding

RequestHeader append Accept-Encoding "gzip,deflate" env=HAVE_Accept-Encoding

</IfModule>

</IfModule>

<IfModule mod_filter.c>

AddOutputFilterByType DEFLATE text/html text/plain text/css \

application/json text/javascript application/javascript application/x-javascript text/x-js text/ecmascript application/ecmascript text/vbscript text/fluffscript \

text/xml application/xml text/x-component \

application/xhtml+xml application/rss+xml application/atom+xml \

image/x-icon image/svg+xml application/vnd.ms-fontobject application/x-font-ttf font/opentype

</IfModule>

</IfModule>

Что думаете - поможет?

IL
На сайте с 20.04.2007
Offline
435
#27
Iggo:
Что думаете - поможет?

Думаю, что не поможет.. Но проще всего поставить и проверить (если, конечно, будет работать в принципе).

1 23

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий