Google Referer Decode

12
LM
На сайте с 30.11.2001
Offline
71
LiM
#11
Как писал CopyLeft
технически - да, браузер. НО - он то его откуда берет?
(готовьте помидоры :)
это же локейшен, на который его гугл отправил!
и броузер его НЕ правит! как есть отдает!

реферер, который отдает браузер - это адрес той страницы, на которой была ссылка на Вашу страницу. Другого не бывает :)


как я уже писал - нормально декодируемых запросов - все го лишь 3-5% !!!!
что и вырубает :о(

Странный объем... На каком языке у Вас разбор логов идет?

Для PHP могу подсобить кодом, который у меня ни разу пока сбоев не давал...

С уважением, Андрей Хроленок. Загляни в FAQ по оптимизации и продвижению сайтов (http://www.seoman.ru/FAQ/) Анализатор страниц сайтов (http://www.seoman.ru/analizer/)
T
На сайте с 14.11.2002
Offline
61
#12
смотрел, все от ие4 и фаербердов с операми, до последних патчей ие 6.ххх в рамблерах и яндексах логично что с ними все ок.

Вот для третего и четвертого случая, как говорил Станиславский "Не верю!!!!". Строки из лога в студию, желательно с IP. Ибо есть еще один вариант, что искажается реферер кривой прокси, хотя этот вариант маловероятен.

он то его откуда берет?

Попробуй открыть 3-й,4-й рефереры в любом браузере, и посмотри на результат. Оба реферера ну ни как не похожеи на реальный урл с текстом запроса.


ХостТрекер | Мониторниг доступности вебсайтов. (http://host-tracker.com/ru/) Уведомление на e-mail или SMS.
CL
На сайте с 28.12.2004
Offline
8
#13
Как писал temofey

Вот для третего и четвертого случая, как говорил Станиславский "Не верю!!!!". Строки из лога в студию, желательно с IP. Ибо есть еще один вариант, что искажается реферер кривой прокси, хотя этот вариант маловероятен.

Попробуй открыть 3-й,4-й рефереры в любом браузере, и посмотри на результат. Оба реферера ну ни как не похожеи на реальный урл с текстом запроса.

открывал. почти сразу же. результат я думаю объяснять не надо - ессесно чушь вышла...

а логи:

3)

81.176.37.18 - - [02/Dec/2004:14:16:18 +0600] "GET /free/?sys=cplace&gid=2625&d=0 HTTP/1.0" 200 35737 "http://www.google.com/ie?q=%F2%27%F2%9C%F2%3F%F2%3F%F3%27+%F2%3F%F2%3F%F2%3F%F2%3F%F3%3F%F2%A3%F2%2B%F2%A3%F3%3F%F3%3F%F2%3F&hl=ru" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)"

4)

195.177.126.194 - - [01/Dec/2004:21:18:01 +0600] "GET / HTTP/1.0" 200 12597 "http://www.google.com/search?q=\"\xf2'\xf2?\xf3?\xf2?\xf2?\xf2\xde\xf2\x14\xf3?\xf2?\xf2\xa3\xf2? \xf3?\xf2\xa3\xf2?\xf2?\xf3'\xf2? \xf2\x9e\xf2\x9c\xf2?\xf2?\xf2?\"&hl=uk" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"

кстати, про проксяки - похоже на них.

вот тока... все одно проблема - ведь почему то "я" и "ра" нормально кейворды пропускают, хоть и народ всяко тоже через проксяки ходит.

а тут, гугловцы - 95% битых рефов...

против статистики то не попрешь... на одни броузеры и проксяки не спишешь.

эти ваши "тили-тили" нас совсем не "трали-вали" ... (с) мой
[Удален]
#14

В 4 случае - это Апач при записи в лог так сделал. Попробуйте \x заменить на %, затем \ убрать, затем этому сделать urldecode.

CL
На сайте с 28.12.2004
Offline
8
#15
Как писал Interitus
В 4 случае - это Апач при записи в лог так сделал. Попробуйте \x заменить на %, затем \ убрать, затем этому сделать urldecode.

попробовал.

болт, надежда не оправдалась....

видимо вопросики тут в тему (вероятнее всего -

это покосяченые при перекодировках символы, безвозвратно утерянные, и теперь не дающие восстановить текст)

\xf2?\xf3?\xf2?\xf2?\xf2\xde\xf2\x14\xf3?\xf2?\xf2\xa3\xf2

->

\xf2\xf3\xf2\xf2\xf2\xde\xf2\x14\xf3\xf2\xf2\xa3\xf2

->

%f2%f3%f2%f2%f2%de%f2%14%f3%f2%f2%a3%f2

->

тутттЮтуттЈт

если обратить внимание, то строки содержащие %fX и подобные символы не декодируются (совсем?), а вот вида %dX - в легкую.

то есть при таком преобразовании на лицо переход от \xFF к %FF, который опознаваться не хотит :о(

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий