Обработка статистики

Polite Moose
На сайте с 22.04.2002
Offline
85
1071

Вопрос от моего программиста (дабы ему не изобретать велосипед) - кто может поделиться прогой на perl для грамотной обработки "конструкций" вида:

Mozilla/4.0 (compatible: MSIE 6.0: Windows NT 5.0: Q312461: .NET CLR 1.0.2914)

или

Mozilla/4.0 (compatible: MSIE 5.0: Windows 95) Opera 6.01 [ru]

или

Mozilla/5.0 (Slurp/cat: slurp@inktomi.com: http://www.inktomi.com/slurp.html)

с целью получения стройной статистики: броузер ххх, операционка yyy, поисковый робот zzz

Особо кривые и неразборчивые "конструкции", а так же поисковики можно оставлять "как есть", главное расчистить основную массу. На данный момент у меня в статистике более 700 "конструкций" с минимальными отличиями.

Заранее спасибо.

------------------

Удачи и настроения!

Удачи, доброго пива (http://www.fifth-ocean.ru/) и настроения! Релевантность определяется не тИЦ, не ВИЦ, не количеством ссылок, не частотой ключевого слова, а соответствием запросу!
[Удален]
#1

Привет, вежливый лось

На перле скрипт думаю придется писать ручками, так как все пользуются аналогом. Он как раз такие вещи позволяет настраивать.

The Browser Report lists the detailed versions of browsers used, and the Browser Summary collects them by vendor. You should be aware that browsers can lie about what sort of browser they are.
The Operating System Report lists the operating systems of the visitors whose browser types you know (as far as possible: it's not always possible to distinguish accurately between different Windows versions, for example, because the same browser can run on more than one Windows version). Which browsers count as robots is controlled by the ROBOTINCLUDE and ROBOTEXCLUDE commands.

Алексей

[This message has been edited by Interitus (edited 08-05-2002).]

Григорий Селезнев
На сайте с 25.09.2001
Offline
298
#2

Обычно поисковый робот (если это он) и браузер совпадают, посему, проще взять (накапливать) список роботов - и делать сопоставление по входящей строке, или можно еще хитрее - все они "грабят" robots.txt , сразу же можно все о роботе получить ...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий