Почему Логи по разному считают статистику?

12
P2
На сайте с 11.03.2006
Offline
7
2694

У меня на сайте установлены Hot, SPY, Smart логи и все выдают статистику отличающуюся друг от друга, а на самом хостинге статистика посещений всегда на процент выше чем в указанных логах. Почему так и кому верить?

Засчитывается ли Логами заход ко мне на сайт на прямую, а не посредством поисковиков и ссылкок?

Злыдень
На сайте с 14.01.2003
Offline
114
#1

самая точная статистика - обработка access.log файла апача (или другого веб-севрера), то есть лог файл доступа к сайту... Он считает все.

Куплю ссылки с ресурсов тематика Строительство (Желательно ЯК).
P2
На сайте с 11.03.2006
Offline
7
#2
Злыдень:
самая точная статистика - обработка access.log файла апача (или другого веб-севрера), то есть лог файл доступа к сайту... Он считает все.

Злыдень, объясни пожалуйста по-русски, что это значит нужно сделать? А то я в инете юзать начал в с августа месяца, не все термины еще понимаю. Заранее спасибо.

Злыдень
На сайте с 14.01.2003
Offline
114
#3

Ну тут опять несколько вариантов.

1. Если у вас платный хостинг - наверняка у хостера есть лог файл доступа к вашему сайту. А может даже и обработчик такого лога в удобоваримы вид, например тот же AWSTATS. То есть надо просто покопаться в панели управления хостингом / поспрашать хостера по этому поводу.

2. Если свой сервер / хостер просто предоставляет вам лог-файлы доступа к Вашему сайту - берете этот текстовичек и сами его разбираете. Либо какой-нить прогой (Semonitor, NetPromoter)? либо самописной штукой (мало ли что вам конкретно нужно).

В любом случае для начала вам стоит узнать/понять - ведется ли лог доступа к вашему сайту. И лучше что бы он велся, и велся в формате "combined" (настройка веб сервера для ведения лога). После этого вам нужно понять/определиться как получить этот лог файл. Ну а потом попробовать разобрать его одной из предложенных прог и сделать свой выбор...

K
На сайте с 31.01.2001
Offline
737
#4

Сервер пишет в логи все HTTP обращения к сайту. Один запрос документа или картинки - 1 строка. Например:

72.30.133.15 - - [14/Mar/2006:11:27:03 +0300] "GET /ogr/countries/19-Aug-2004.html HTTP/1.0" 304 - "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com /help/us/ysearch/slurp)"

Это заход робота Yahoo.

Поэтому, в логах наиболее полная информация в смысле учета количества обращений к сайту. Как из этих хитов получить визиты посетителей и т.д. - это уже вопрос к программе - обработчику этих лог-файлов.

С другой стороны не вся интересная информация в эти логи пишется.

Почитайте RFC о протоколе HTTP, оттуда ноги растут.

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
CG
На сайте с 15.06.2004
Offline
34
#5

Есть как минимум 3 варианта сбора статистики.

1. Анализа логов сервера (Apache, IIS и.т.д)

2. Внешний счетчик.

3. Собственный счетчик.

Есть множество вариантов определения посетителя.

1. По cookies

2. По IP

3. По IP+ Доп. Данные

4. По логину

5. По сессии

6. и.т.д.

Естественно каждая программа и сервис выбирает свой метод, поэтому данные будут отличаться.

Считается что самая точная статистика вариант (1) - Анализ логов сервера.

Это не совсем так в большинстве случаев.

Она самая полная – но не самая точная.

Самая полная, потому что веб сервер фиксирует все обращения к вашему сайту и пишет их в лог файл, нет обращения нет записи.

Хотя и здесь, некоторые хостинговые компании делают нам подарок :)

Даже простейшая запись на диск дает большую нагрузку на сервер, поэтому часто хитрят, обрезают данные.

--------------------------------------

возможный ответ почему

“а на самом хостинге статистика посещений всегда на процент выше, чем в указанных логах.”

--------------------------------------

Но она не точна, так как в 99% веб сервер не фиксирует cookies.

Опять таки не “хостинговые компании” не горят желанием нести дополнительную нагрузку на сервер. Хотя данный вариант сбора статистики почти идеален.

Анализ по Cookies – в комбинации с другими методами (в случаи, если cookies отключен в браузере) – дает максимально приближенную картину посещаемости к реальности.

Без сcookies практически не возможно построить не один маркетинговые отчет.

Рассмотрим вариант

2) Внешний счетчик.

Его преимущества. Пишет cookies.

Все больше их нет :(

Недостатки.

Если пользователь быстро покинет страницу, счетчик может не успеть сработать, соответственно потеря точности статистики, а сервер всегда зафиксирует в лог файле заход пользователя.

Ни на одном счетчике нет следующей информации: загрузка файлов, мультимедийных файлов, флеш-объектов, картинок и др.

Хотя иногда есть но в жуткой форме.

Нет распознавания работы поисковых роботов.

Нет подсчета трафика.

Нет анализа кодов доступа к страницам.

Нет определения метода доступа к страницам.

Нет определения хакерских атак на Ваш сервер.

Главные недостатки Внешнего счетчика.

1. юбой внешний счетчик, расположенный не на вашем сайте, будет терять посетителей,

причины просты.

Загруженность их каналов и серверов.

Даже если сервис купит Очень мощные сервера и Очень мощный интернет канал,

статистика будет не точна. Так как пользователь, который смог открыть Вашу страницу, на которой находиться код счетчика на 99.9% загрузит с вашего сайта картинку собственного счетчика, а вот внешний может и не загрузить, так как канал его провайдера может быть перегружен в сторону сайта предлагающего внешний счетчик.

2. Ваша статистика доступна не только вам, а вашим конкурентам очень бы не помешало знать ваши изыски :), то есть создателям счетчика нужно доверять, ды бы не продали вас :)

3. 1-Party Cookies, P3P, Cсобственно в Интернете много написано об этом вкратце:

Ваш браузер очень обеспокоен нашей безопасностью, поэтому очень часто даже при включенных cookies, он не будет принимать cookies со сторонних сайтов а только с текущего.

Это дает пользователю более и мене защиту от сбора его данных, что и когда он делал.

А что дает это статистике – ложные данные,

Без сcookies практически не возможно построить не один маркетинговые отчет.

То есть этот вариант 50*50 считает посетителей, да еще и не зачитывает.

Примерно золотая середина правильной статистики.

Рассмотрим вариант

3) Собственный счетчик.

Недостатки.

все что и у внешнего счетчика

Кроме главных недостатков.

То есть только данный подход, как правило, может показать реальную картину посещаемости, и служить не заменимым маркетинговым инструментом.

Перец
На сайте с 11.07.2004
Offline
220
#6
Злыдень:
самая точная статистика - обработка access.log файла апача (или другого веб-севрера), то есть лог файл доступа к сайту... Он считает все.

А какой анализатор логов даёт такую точную статистику? У меня они показывают разные цифры:

/ru/forum/40657

CG
На сайте с 15.06.2004
Offline
34
#7

А не один не даст, так как статистика в корне не правильна.

То есть теоретически только кол-во Хитов должно быть идентичным у всех.

Столько сколько линий в лог файле на текущую дату, если там нет ошибочных, например сбой apache, хотя очень редко такое бывает.

Опять таки стоит также вопрос, а учитывать ли показы вашего баннера на другом сайте?

Будет анализатор в общее число считать этих посетителей или нет?

На практике можете создать лог файл с несколькими строчками и проверить. Только так можно получить ответ на ваш вопрос.

CG
На сайте с 15.06.2004
Offline
34
#8

Еще необходимо учесть, а куда девает поисковые системы анализатор, различные неизвестные спайдеры, и.т.д. и прочую начесть

важны ведь люди только живые люди, а их не так просто посчитать :)

Злыдень
На сайте с 14.01.2003
Offline
114
#9
Can-guru:
Она самая полная – но не самая точная.

Абсолютно согласен. Это и имел в виду.

Перец:
А какой анализатор логов даёт такую точную статистику?

Нельзя сказать что какой-то анализатор логов дает точную статистику, а какой-то не точную.

Например, за 3 февраля у меня было.

По показаниям Awstats - 970 посетителей

по показаниям LogAnalizator Semonitor - 1340 Посетителей, из них 345 поисковики.

То есть цифры примерно одинаковые.

А так что бы совпало до единички - думаю такого не бывает. Везде есть своя погрешность.

Перец
На сайте с 11.07.2004
Offline
220
#10
Can-guru:
А не один не даст, так как статистика в корне не правильна.

То есть теоретически только кол-во Хитов должно быть идентичным у всех.

Ну, мне-то нужны только переходы с поисковиков. Т.е. анализ реферов.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий