Пользователи и пауки

deleon
На сайте с 16.09.2004
Offline
173
902

Написал небольшую статью:

Определение пауков и пользователей в статистике

с собственным примером на PHP.

Буду рад, если это поможет вам при написании собственной статистики.

С удовольствием приму все замечания и предложения!

---

Александр

J
На сайте с 01.09.2006
Offline
17
#1

Немножко оффтопика.

А никто не подскажет, что это за зверь такой?

85.21.249.75 - - [16/Jan/2007:16:25:23 +0300] "GET / HTTP/1.1" 200 41 "-" "-"

В логах апача нет ни юзер-агента, ни браузера, ни ОС…

deleon
На сайте с 16.09.2004
Offline
173
#2
Jashiin:
Немножко оффтопика.
А никто не подскажет, что это за зверь такой?
85.21.249.75 - - [16/Jan/2007:16:25:23 +0300] "GET / HTTP/1.1" 200 41 "-" "-"
В логах апача нет ни юзер-агента, ни браузера, ни ОС…

Сложно сказать...может какой-нибудь школьник-студент тестирует очередной, собранный на коленке, Гугл 😕

M
На сайте с 23.08.2001
Offline
74
#3
Jashiin:
Немножко оффтопика.
А никто не подскажет, что это за зверь такой?
85.21.249.75 - - [16/Jan/2007:16:25:23 +0300] "GET / HTTP/1.1" 200 41 "-" "-"
В логах апача нет ни юзер-агента, ни браузера, ни ОС…

Это может быть что угодно, не обязательно паук. Ты hostname посмотри, и все станет ясно.

P.S. Еще бы статейка бы загрузилась для полного счастья....

C уважением, Михаил. http://mike.nov.ru/ (http://mike.nov.ru/)
M
На сайте с 23.08.2001
Offline
74
#4
deleon:
Написал небольшую статью:

Определение пауков и пользователей в статистике

с собственным примером на PHP.
Буду рад, если это поможет вам при написании собственной статистики.

С удовольствием приму все замечания и предложения!

---
Александр

Еле пробился, сайт еле грузится.

Вообще статья написано явно начинающим. Все это способы не дадут даже близко реальной картины. Многие боты маскируются под пользователей, и наоборот.

Есть только один верный способ - его использует CNStats.

Счетчик состоит из трех частей. Две выполняются на сервере и одна у клиента.

1. В момент обращения к странице собирается общая информация - все что можно взять из запроса и переменных среды - IP, Агент, Адрес, Реферер и генерируется JavaScript код.

2. JavaScript код выполняется на клиенте, определяется включены ли Cookies. Робот скорее всего не будет обрабатывать JavaScript. JavaScript код загружает картинку - счетчик с сервера.

3. Счетчик-картинка проверяет включенность Cookies и идентифицирует пользователя.

Даже если робот и поддерживает JavaScript, то картинку он загружать не станет.

Роботы учитываются на первом шаге, пользователи не третьем.

Заранее извиняюсь если сумбурно объяснил :)

safer
На сайте с 12.07.2006
Offline
14
#5

есть програмка , которая по IP инфу выдаёт. Советую. Называется: SmartWhois

M
На сайте с 23.08.2001
Offline
74
#6
safer:
есть програмка , которая по IP инфу выдаёт. Советую. Называется: SmartWhois

Так она ничего не скажет если я на своем сервере запущу индексатор какой-нибудь поисковой системы.

deleon
На сайте с 16.09.2004
Offline
173
#7
mikek:
Все это способы не дадут даже близко реальной картины. Многие боты маскируются под пользователей, и наоборот.

А вот это вы зря. Погрешность вряд ли будет превышать 15-20%, а этого в большинстве случаев хватит с головой обычному пользователю.

M
На сайте с 23.08.2001
Offline
74
#8
deleon:
А вот это вы зря. Погрешность вряд ли будет превышать 15-20%, а этого в большинстве случаев хватит с головой обычному пользователю.

Ничего себе мелочь такая - вместо 100 тыс пользователей 80 тыс. А ведь все это выливается в существенную потерю денег или владельцем сайта или рекламодателем.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий