У MSIE есть глюк, в результате которого он в качестве ссылающейся страницы дает "левый" адрес, предыдущий реферер (откуда пришли на ту страницу, с которой перешли на вашу) или адрес страницы открытой в другом окне. В общем, сбагривает сайтам избыток своих рефереров :)
Народ, написано ведь, что в запросе находится адрес страницы. Или вы не в курсе значения параметра q у гугла?
Seliger, возможно, кто-то шутит, давая ссылку на эту страницу (или не шутит, если содержимое соответствует) во всяких форумах извращенцев, но дает непрямую ссылку, а либо через поисковик, либо ссылку в виде простого текста (то есть нажать нельзя, а только скопировать вручную в адресную строку), поэтому реферер пустой.
Сначала пытаешься декодировать как UTF8, не получилось - считаешь, что запрос в cp1251. Работает в 99.9% случаев.
Один из списков с 500+ поисковиками (приблизительно годовой давности) в виде перлового модуля:
http://ktmatu.com/software/relax/supported-search-engines.html
Не яву, а яваскрипт, и не "обрабатывающий" в смысле "исполняющий", а "обрабатывающий" в смысле "выцепляющий из кода нечто похожее на ссылки".
Хотя и исполнение JavaScript'а в каких-то определенных рамках, похоже, грядет. Народом был замечен GoogleBot, загружающий javascript-счетчик: http://www.webmasterworld.com/forum30/32584.htm
(дурацкий форум, нужно будет еще кликнуть в ссылку "Passed URL:")
Хотя, может, автор что-то напутал, и GoogleBot загружал картинку не из javascript-секции.
Хм, отстал я от жизни :)
Если счетчик LiveInternet установлен в виде одной картинки (а не в двух - счетчик и логотип), то он находится полностью в JavaScript-коде. Насколько я знаю, никакие поисковики JavaScript не обрабатывают, поэтому в LiveInternet ваш ценный PR не утекает.
Когда в следующий раз возьметесь кому-нибудь писать письма, используйте работающий почтовый ящик. Весь ваш домен radioweb.ru не работает, так как не работают обслуживащие его DNS-сервера.
Там внизу справка есть: "Данный отчет формируется из отчета "переходы со страниц" путем объединения страниц по именам серверов". Имя сервера (сайта) - это то, что идет после http:// и до первого слеша.
Сайт поисковика всегда (или почти всегда) отличается от сайта почты (yandex.ru - mail.yandex.ru, rambler.ru - mail.rambler.ru, go.mail.ru - win.mail.ru). Если же у кого-то не отличается, то и в отчете это будет идти одной строкой.
Можно не делать парсер, а нажать на ссылку "csv", которая находится под некрасивым графиком.
NektoAndrey, возможно, имелись в виде не pageview, а общее количество запросов (включая картинки). Ну а 60 млн в любом случае не получается, потому что сказано про пиковое значение, а не среднее.
LiveInternet сейчас по всем сайтам в дневном пике учитывает около 3.5 тысяч pageview в секунду, в сумме за день получается 180 миллионов. У отдельных популярных сайтов (photofile.ru, rbc.ru) пиковое значение pageview - 50-70/сек.
А вот для mail.ru - около 700/сек