Гуру! дайте совет....

freefall
На сайте с 19.08.2004
Offline
77
726

есть сайтик,

проблема в том, что в статистике вижу на 2й позиции страницу 404.html

ошибок на сайте нет. жалоб не поступало,

что прикрутить на эту страницу чтобы увидеть откуда заходят или какие ошибки допускают посетители.

прикол в том, что 404 выдается не по ссылке с другой страницы (тогда просто узнать, откуда пришел юзер - через переменную refer), проблема в том, что 404 выдает сам апач (он ее знает из своих настроек) - потому у меня и слабая надежа на счетчик.

заранее спасибо

LM
На сайте с 30.11.2001
Offline
71
LiM
#1

Что за статистика?

Приведите пример, как в статистике показывается ошибка.

Есть ли доступ к логам Апача?

Если есть, приведите пару строк из лога с этими ошибками.

Можно в личку...

С уважением, Андрей Хроленок. Загляни в FAQ по оптимизации и продвижению сайтов (http://www.seoman.ru/FAQ/) Анализатор страниц сайтов (http://www.seoman.ru/analizer/)
SilverMaster
На сайте с 08.10.2003
Offline
228
#2
Как писал LiM
Что за статистика?
Приведите пример, как в статистике показывается ошибка.
Есть ли доступ к логам Апача?
Если есть, приведите пару строк из лога с этими ошибками.

Можно в личку...

а можно и не в личку - поможем чем сможем ;)

Из детских комшаров: "А вдруг ночью придет страшный робот!" Из взрослых: "И криво проиндексирует сайт". Не всякий гик добежит до середины поисковой страницы гугла
freefall
На сайте с 19.08.2004
Offline
77
#3

> Что за статистика?

у меня хостер : www.mirohost.net какая конкретно у них не знаю, может сами прикрутили.

> Приведите пример, как в статистике показывается ошибка.

в статистике об ошибках вооще ничего не сказано проcто пишется:

по посещаемости № 1 - это "корень"

№ 2 - это 404

№ 3 - это скрипты, логотип и пошел перечень.

> Есть ли доступ к логам Апача?

хостер дает файлы:

domen.com-error_log

domen.com-access_log

> Если есть, приведите пару строк из лога с этими ошибками.

[Wed Dec 1 15:11:04 2004] [error] [client 66.196.90.96] File does not exist: /var/www/domen/domen.com/robots.txt

Дальше я сам допустил ошибку, что бы проверить, но и до этого был заход на 404

[Wed Dec 1 15:49:14 2004] [error] [client 80.254.7.1] File does not exist: /var/www/domen/domen.com/ljfdnvafd

Эту ошибку допустил посетитель

[Wed Dec 1 16:10:41 2004] [error] [client 159.148.237.9] File does not exist: /var/www/domen/domen.com/ru/machines/b_3

[Wed Dec 1 16:24:55 2004] [error] [client 66.196.90.243] File does not exist: /var/www/domen/domen.com/robots.txt

все остальные и предедущие только ругаются на робот.тхт

LM
На сайте с 30.11.2001
Offline
71
LiM
#4

Статистика, судя по всему, малоинформативная :(

Файл domen.com-access_log позволяет Вам получить очень много полезных отчетов через другие лог-анализаторы. Только проверьте, чтобы он не обрезался - бывает так, что там сидят логи только за текущий день.

Приведенные Вами строки из логов, судя по их виду, идут из файла domen.com-error_log. Давно им не пользовался :)

Файл /var/www/domen/domen.com/robots.txt запрашивается поисковыми роботами (вот подробнее, что это такое). А остальные строки Вы сами описали. Судя по Вашим комментариям, их всего пара штук - значит нет смысла беспокоиться... :)

freefall
На сайте с 19.08.2004
Offline
77
#5

если бы пару раз всего, я бы не искал ответ,

НО в результатах статистики 404 стоит второй. (+ у меня таких сайтов несколько, и везде такое)

webalyzerom раз в неделю формируются файлы штмл - отчеты.

Вот примеры строк из журнала access.log , где есть 404:

lj1144.inktomisearch.com - - [01/Dec/2004:04:15:17 +0200] "GET /404.html HTTP/1.0" 200 11941 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)

207.46.98.50 - - [01/Dec/2004:15:04:32 +0200] "GET /404.html HTTP/1.0" 200 11941 "-" "msnbot/0.3 (+http://search.msn.com/msnbot.htm)"

smocke.swip.net - - [02/Dec/2004:01:35:46 +0200] "GET /ru/pt/swep.htm/ HTTP/1.1" 302 295 "-" "Nokia7210/1.0 (5.52) Profile/MIDP-1.0 Configuration/CLDC-1.0"

smocke.swip.net - - [02/Dec/2004:01:35:47 +0200] "GET /404.html HTTP/1.1" 200 11981 "-" "Nokia7210/1.0 (5.52) Profile/MIDP-1.0 Configuration/CLDC-1.0"

вообще есть две статистики:

- одну считаем вебализер

- вторую встроенный счетчик в страницу

ни одна из статистик не дает ответа, откуда попадают на 404

LM
На сайте с 30.11.2001
Offline
71
LiM
#6

Так...

Сейчас в настройках сервера стоит переброс клиента на файл /404.html, если нет запрошенного.

Сайт mirohost.net стоит на сервере под Апачем. Даже если Ваш сайт стоит на другом сервере, скорее всего там тоже Апач.

Попробуйте в корень сайта положить файл с именем ".htaccess" (c точкой в начале!) и вот таким содержимым:

ErrorDocument 404 /404.html

Если файл .htaccess уже есть, временно его замените на новый.

Далее попробуйте зайти на несуществующую страницу и посмотреть, что у Вас ложится в логи.

У вас должен получить не переброс на новый адрес, а замещение несуществующей страницы содержимым файла /404.html. В логах должно получиться что-то типа такого:

smocke.swip.net - - [02/Dec/2004:01:35:46 +0200] "GET /ru/pt/swep.htm/ HTTP/1.1" 404 11981 "-" "Nokia7210/1.0 (5.52) Profile/MIDP-1.0 Configuration/CLDC-1.0"

freefall
На сайте с 19.08.2004
Offline
77
#7

залил

теперь у меня в .htaccess такие строки:

AddType application/x-httpd-php .php .htm .html .phtml

ErrorDocument 404 /404.html

в лог прописало такую строку:

smocke.swip.net - - [02/Dec/2004:13:53:18 +0200] "GET /mama HTTP/1.0" 404 11941 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"

я так понял, что получилось то что хотели, как я могу увидеть эту ошибку в статистике? или только "ручками" искать в access_log ?

в старом было так:

AddType application/x-httpd-php .php .htm .html .phtml

ErrorDocument 404 http://www.domen.com/404.html

SetEnvIf User-Agent ^Teleport getout

SetEnvIf User-Agent ^Offline getout

SetEnvIf User-Agent ^DISCo getout

SetEnvIf User-Agent ^netvampire getout

SetEnvIf User-Agent ^iNET getout

SetEnvIf User-Agent ^Website getout

SetEnvIf User-Agent ^Wget getout

Order deny,allow

Deny from env=getout

LM
На сайте с 30.11.2001
Offline
71
LiM
#8

freefall,

О... отлично, что старый привели.

В нем строку

ErrorDocument 404 http://www.domen.com/404.html

достаточно заменить на

ErrorDocument 404 /404.html

и все будет нормально работать.

webalizer нормально отрабатывает такие логи - это штатная ситуация и в отчете по несуществующим страницам (если правильно помню, такой есть в webalizer'е) будут показываться их адреса.

Про счетчик не скажу - сами изучайте.

А страницы, откуда стоят ошибочные ссылки можно вытаскивать из этих же логов либо другими анализаторами (webalizer такого не дает; analog, кажется, дает), либо банальной фильтрацией лога по строке " 404 " (с пробелами вокруг числа) - я именно так и делаю.

Адрес страницы со ссылкой в строке логов идет после кода ответа и длины страницы (...404 11941 "-"... <- вместо прочерка из Вашего примера).

freefall
На сайте с 19.08.2004
Offline
77
#9

спасибо, что помогли разобраться :-)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий