Это довольно сложно, определять прописку пользователья по ip, нужно
постоянно обновлять огромную базу, если мне память не изменяет, то в таких системах база адресов имеет размер 5-10 Мб в пакованном виде.
Практически с такой же точностью и на несколько порядков проще анализировать язык посетителя (переменная HTTP_ACCEPT_LANGUAGE).
А для поиска могу посоветовать следующие ключевые слова - cgi, mod_rewrite, .htaccess. Кстати довольно продвинутое место в этом
плане форум xpoint.ru, покопавшись в архивах там ты найдешь ответ
практически на любой вопрос.
Если вопрос доступа критичен, то можно найти тот прокси который и не тормозит. А насчет настроек, то во всех "модных" броузерах есть такая фича как автоконфигурация прокси, если с javascriptom дружишь, то твоя задача решается в пять строчек.
Почитать можно здесь
http://library.nstu.ru/mashkov/disk3/WEBMASTER/proxy-live.html.
Попробуй через общедоступный прокси. Перепробу несколько наверняка найдешь с которым доступ нормальным будет.
awk тебе поможет, правда доку внимательно почитать придеться.
Можешь для отладки в поисковики записать ИЕ, потом не забудь его оттуда выкинуть, а то пользователи получат твой "спецконтент" :-)
Еще можешь воспльзоаться lynx, у него в настройках можно записать кем представляться.
Да. Так как версии могут отличаться.
У меня такая же цифра получается.
Yandex/1.03.000 (compatible; Win16; M)
StackRambler/2.0
Довольно эффективный способ - это сессию определять по user-agent, если там записан поисковый-робот, то работаем с ним как с отдельным "особым" пользователем, если же это броузер то начинаем приплетать куки и другие радости.
> как узнать сколько реально добавило страницу в избранное?
по favicon.ico в логах. С учетом того что ИЕ, наиболее массовый броузер то показатели будут довольно точны. Можно еще из общего числа вычесть тех юзер агентов которые автоматом берут favicon.