Не учтётся. Иначе поисковик должен ещё и скрипт выполнять - а не его это дело. Кроме того, правила хорошего тона предполагают блок <noscript>...</noscript> писать для браузеров, где скрипт недоступен или выключен
Просто распознал - в логах он честно подписывается GOOGLEBOT.
его IP - 64.68.82.*
если даже не 64.68.*.*
Да ещё прогнал базу счётчика (у нас свой счётчик для сайтов, мной написанный - он там до чёрта всяких данных о сессии собирает. Практически, аналог спайлога - только свой и база у себя. Любой анализ посещений сделать можно) по специальному алгоритму.
Идея алгоритма проста, как валенок: во-первых, практически все роботы ходят по 1 странице за сессию (достоверно установлено всё по тем же логам), во-вторых, ходят "пакетом" (т.е. подряд просматривают несколько страниц - иногда даже все подряд, с интервалом захода не более 10 секунд), да и время просмотра страницы - считанные секунды. Сопрягаем всё это в скрипте - и пожалуйста. Но, к сожалению, этого недостаточно, да и не факт, что какой-то робот станет ходить как простой посетитель - по нескольку страниц за одну сессию.
Можно
<--include file="links.htm"-->
Всем привет!
Снова я. 😎
Всё продолжаю ковыряться с разного рода поисковиками, роботами, каталогами и т.п.
Вот, попалось, пока гугл ковырял:
http://www.google.com/search?q=cache:9JPmB4SSBtQJ:<URL>+<строка запроса>&hl=ru&ie=UTF-8
Ну понятно, URL и строку запроса я не привожу - они не важны. 🚬
Вопрос в другом - хвост этой строки - явно настройки кодировки (последовательности). Кто-нибудь их синтаксис знает? Мне моего робота-анализатора научить надо :)
В статических сайтах:
1) в свойствах сайта на сервере добавить свойство "Last-Modified", его значение установить (вручную) в формате любой приемлемой строки, например "09.10.2003 13:00 MSK"
2) В заголовке HTML:
<HTML>
<HEAD>
....
<META HTTP-EQUIV="Last-Modified" content="09.10.2003 13:00 MSK">
...
</HEAD>
</HTML>
В динамических сайтах
ASP:
<%
var data=new Data();
Response.AddHeader ("Last-Modified",""+data);
%>
<META HTTP-EQUIV="Last-Modified" content="<%=data%>">
(или вывести через Response.Write("<meta http-equiv=....")
PHP:
<?php
header('Last-Modified: '+date("F d Y H:i:s.", getlastmod()));
?>
(по PHP см. также http://php.rinet.ru/manual/en/function.getlastmod.php )
Успехов!
не вредно сделать 2 вещи:
1) на сервере:
Прописать параметр Content-Type в значение windows-1251.
Неплохо бы и дату последнего изменения Last-Modified прописать; если сайт управляемый (ASP, PHP и т.п.) - то можно передать параметр на сервер.
2) В коде в <head>:
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
Спасибо, но забыл сказать - ASP (language=Javascript) & MS-SQL-Server-2000
Был бы php - я бы так не мучался, но noblesse oblige ...
:(
Ок, спасибо. Но проблема в том, что все обработтчики я пишу сам - типа UDF (User defined function), бОльшая часть - непосредственно на уровне запроса в SQL. Подскажите, где взять таблицы кодировок. 😎
Или старым дедовским способом вбить алфавит и гонять штирлицем? 🚬
А не пробовали собственные заходы отключить в хотлоге?
И всё-таки... Кто-нибудь знает, что за кодировка применяется на 2 и далее страницах поиска яндекса?
Подстрока выглядит так: "qs=text%3D%25C4%25C1%25CA%25D7%25C9%25CE%25C7%2B%25CE%25C1%2B%25ED%25C1%25CC%25D8%25D4%25C5%26tb%3D1"
находим слово 'qs=', преобразуем получившееся в "text=%C4%C1%CA%D7%C9%CE%C7+%CE%C1+%ED%C1%CC%D8%D4%C5&tb=1", и вот отсюда я так и не могу найти кодировку (начальный запрос - "дайвинг на Мальте")