Webalizer и русский язык.

12
S
На сайте с 28.02.2006
Offline
0
3238

один добрый вебмастер, строивший сайт по интересной мне теме, оставил открытый доступ в /stat, куда выкидываются результаты работы вебалайзера. ;)

к сожалению, поисковые запросы, приводившие на сайт, искажены до полной нечитабельности.

не подскажет ли кто-нибудь можно ли "извне" как-то все-таки прочитать эти запросы?

а может можно как-нибудь выкачать сами логи?

Коля Дубр
На сайте с 02.03.2005
Offline
153
#1
shroff:
искажены до полной нечитабельности

ну так видимо искажены как-то алгоритмически =)

значит нужно посидеть-подумать, восстановить алгоритм и промотать в обратную сторону. Скиньте пример, может кто сообразит...

Разрабатываю общую шину (http://habrahabr.ru/company/floxim/blog/268467/) помаленьку. ...а еще у меня есть бложек (http://www.blogovo.ru/).
I
На сайте с 22.10.2005
Offline
58
Iso
#2

Как я понял, обратное преобразование делается http://php.rinet.ru/manual/ru/function.rawurldecode.php

Я раньше делал примерно так: echo rawurldecode(implode('',file('http://qwe/webalizer/.../'))); и смотрел всё нормально.

smscat
На сайте с 23.02.2006
Offline
50
#3
shroff:
один добрый вебмастер, строивший сайт по интересной мне теме, оставил открытый доступ в /stat, куда выкидываются результаты работы вебалайзера. ;)
к сожалению, поисковые запросы, приводившие на сайт, искажены до полной нечитабельности.

не подскажет ли кто-нибудь можно ли "извне" как-то все-таки прочитать эти запросы?
а может можно как-нибудь выкачать сами логи?

народ наверно прикалывается.

поисковые запросы в вэбалайзере искажены потому, что поисковики принимают запросы в разных кодировках. Проще всего с запросами google и msn - достаточно браузер переключить в отображение utf-8. Апорт и Румблер работают с cp1251. яндекс принимает запросы как в cp1251 так и в koi-8. недавно писал анализатор логов (http://establishment.com.ua/getsearch.pl) с разбором поисковых запросов и столкнулся с проблемой определения кодировки в запросах Яндекса (мой простенький алгоритм выручает в ~90% случаев, но это не фонтан для чего-то серьёзного)

S
На сайте с 28.02.2006
Offline
0
#4
Коля Дубр:
ну так видимо искажены как-то алгоритмически =)
значит нужно посидеть-подумать, восстановить алгоритм и промотать в обратную сторону. Скиньте пример, может кто сообразит...

вот так это выглядит под виндовой кириллицей.

я-п+п¦я- яLп+я-п+

я-п¦п+п¦п¦п¦я¦п¦п¦я¦ п¦пTп¦я-п¦

п+п¦я¦я¦п¦пT

пЁп¦п©п¦я-пTя-

пЁп¦п¦п+п+я-пTя-

п¦п¦п¦ пTп¦п¦п¦я-п¦п+п¦п+п¦я-я-

п я-п¦п+п¦п¦п¦я¦п¦п¦я¦ п¦пTп¦я-п¦

п¦я-я-я-пTя-

п+п©я-п¦п¦п¦п¦п¦п+пTп¦ п©п+п¦п¦ я-п¦п¦п¦п+п¦п¦

smscat
На сайте с 23.02.2006
Offline
50
#5

хм.. не исключено, что дело в русском апаче. но более детально могу сказать лишь глянув... (кинь ссылку в личку)

если шаришь в диррективах апача можешь попробовать сам поэкспериментировать с перекодировкой (а лучше просто отруби её)

ЗЫ не понимаю зачем в 21м веке можно делать перекодировку страниц апачем и зачем вобще в апаче такая фишка (вопрос риторический - отвечать не надо =)

N
На сайте с 18.05.2003
Offline
100
#6

Нереально сделать обратное преобразование.

И вообще вебалайзер на данный момент - это вредительская программа. Особенно в настройках по умолчанию. Хостер обзывает, что статистика есть, но то, что выдает вебалайзер с точки зрения продвигатора - это это на уровне "Ни хрена".

S
На сайте с 28.02.2006
Offline
0
#7
Newm:
Нереально сделать обратное преобразование.

Хостер обзывает, что статистика есть, но то, что выдает вебалайзер с точки зрения продвигатора - это это на уровне "Ни хрена".

ну почему же "ни хрена". можно узнать с какой страницы заходят пользователи. поскольку сайт не мой то даже это знание полезно :)

S
На сайте с 28.02.2006
Offline
0
#8
smscat:
не исключено, что дело в русском апаче. но более детально могу сказать лишь глянув... (кинь ссылку в личку)
если шаришь в диррективах апача можешь попробовать сам поэкспериментировать с перекодировкой (а лучше просто отруби её)

к сожалению, не шарю пока. а что их можно как-то задавать "извне"? без пароля администратора?

smscat
На сайте с 23.02.2006
Offline
50
#9
Newm:
Нереально сделать обратное преобразование.

нереально то, что считается нереальным.

про обратные преобразования кстати речи и небыло.

предлагалось ОТКЛЮЧИТЬ перекодировку на стороне Apache.

для этого обычно достаточно внести одну строчку в .htaccess

Newm:
И вообще вебалайзер на данный момент - это вредительская программа. Особенно в настройках по умолчанию. Хостер обзывает, что статистика есть, но то, что выдает вебалайзер с точки зрения продвигатора - это это на уровне "Ни хрена".

Так требуй настроек, либо webalizer.conf в свои руки. Лично я отключаю лимит на показ Referer(с исключением домена самого сайта) User-Agent, и прописываю разборщики для запросов русских и украинских поисковиков

AllReferrers	yes

AllAgents yes
AllSearchStr yes
HideReferrer _mysite.ru/
HideReferrer Direct Request
SearchEngine yandex.ru text=
SearchEngine meta-ukraine.com q=
SearchEngine meta.ua q=
SearchEngine meta.com.ua q=
SearchEngine go.mail.ru q=
SearchEngine search.bigmir.net q=
SearchEngine rambler.ru words=

тогда это становится очень даже полезным.

I
На сайте с 22.10.2005
Offline
58
Iso
#10
smscat:
предлагалось ОТКЛЮЧИТЬ перекодировку на стороне Apache. для этого обычно достаточно внести одну строчку в .htaccess
Так требуй настроек, либо webalizer.conf в свои руки.

smscat, топикстартер указал, что это данные с сайта конкурента. Поэтому, он не может исправить настройки.

Декодировать эти данные, действительно, практически не возможно.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий