Закладки в логах - как расшифровать?

[Удален]
881

Здравствуйте.

Трафик радует, однако стало тяжело понять, что же людишки набивают в окошке поиска - до сих пор я составлял примерную статистику этого, тупо копируя закладки типа http://www.rambler.ru/search?q=%D0%94%D0%B5%D1%82%BA+%D0%B2+ в адресную строчку.

Однако, догадываюсь, что так никто не делает. Подскажите, пожалуйста, КАК надо делать? Поделитесь скриптами.

Спасибо

-=IgorStr=-
На сайте с 28.11.2005
Offline
8
#1

если у вас есть возможность работать с SQL, то вот хорошая прога сбора и ананализа стат.данных по сайту

демо-вход: http://stats.poleznoe.ru/cnstats/

стоит всего 20$

Independence
На сайте с 29.10.2005
Offline
428
#2

Вообще, есть куча программ статистики типа вебалайзера, веблога и пр. Если поискать в поисковике, то можно найти отдельно им посвященные обзоры. Я тестировал многие из них.

Часто встречается проблема, что они не знают русских поисковиков, поэтому наши выпадают из их статистических обзоров (тогда нужно править код руками) и нельзя отследить статистику. Плюс они не могут декодировать кириллицу, поэтому даже те же запросы в Google показываются в нечитаемом виде.

Я думаю, что при определенных усилиях можно найти программы с поддержкой русского языка.

Сам я пользуюсь собственным Perl-скриптом, который разбирает стандартный апачевский лог. Он небольшой и выцепляет из лога все поисковики и запросы к ним + то, что остается, кроме поисковиков, - в отдельные файлы (.txt, .html, как угодно), которые можно дополнительно изучать и рассматривать. Правда, декодируются не все запросы, а только на латинице и в одной из кодировок кириллицы, то есть иногда он тоже может вывести те же %3D%25EB и т.п. Почему так? Просто в силу загруженности и использования от случая к случаю, пока руки никак не доходят сделать для всех возможных вариантов. Нужно добавить дополнительную подпрограмму с раскладкой символов.

Если не найдете нормальный скрипт и если кому-то уж очень сильно надо будет, могу продать скрипт за символическую плату, тогда еще и появится стимул попробовать его доделать; но сразу скажу, что писал для себя и писать крутой профессиональный анализатор с графикой нет физических сил и за деньги.

I
На сайте с 22.10.2005
Offline
58
Iso
#3

в PHP такие строки вытаскиваются функцией rawurldecode()

[Удален]
#4

В принципе, меня вполне устроила бы возможность раскодирования хреномути вроде ...b2%b3%c4%+d5%c3%... в ручном, так сказать, режиме. Типа промта чтобы работало - как простой переводчик.

I
На сайте с 22.10.2005
Offline
58
Iso
#5

помести у себя на сайте файло decode.php с кодом

<? echo rawurldecode($s);?>

И обращайся по адресу yoursite.ru/decode.php?s=СтрокаДляДекодирования

SS
На сайте с 03.09.2004
Offline
141
#6
Радиатор:
людишки

Какое пренебреженительное отношение к посетителям своего сайта.

Почему-то по прочтении этого слова у меня сейчас аналогичное чувство сложилось к Вам. 🙅

«Клянусь своей жизнью и любовью к ней, что никогда не буду жить ради другого человека и никогда не попрошу и не заставлю другого человека жить ради меня» (с) Джон Галт
[Удален]
#7

Работает, Iso, спасибо большое. Причем так, как надо - буду с Денвером мутить (поставил Денвер, хотя не умею им пользоваться). Сервер, если кто не знает.

Странная вещь. Если закладку Гугла забить в строчку адреса (равно как и используя способ Iso), отображается какая-то ерунда - греческие буквы.

Seventh Son, многим свойственно КАЗАТЬСЯ грубыми или пренебрежительными. Давлю в себе это. Конечно же, я хорошо отношусь к посетителям своего сайта.

I
На сайте с 22.10.2005
Offline
58
Iso
#8

чтобы кодировка результата была правильная, попробуйте ещё

header('Content-type: text/html; charset=windows-1251');

добавить ПЕРВОЙ строчкой

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий