bnz

Рейтинг
10
Регистрация
14.05.2003
Должность
Web sites building
Интересы
Diving, karate, aikido
born & yet not died

Не учтётся. Иначе поисковик должен ещё и скрипт выполнять - а не его это дело. Кроме того, правила хорошего тона предполагают блок <noscript>...</noscript> писать для браузеров, где скрипт недоступен или выключен

Как писал Interitus

Это как это?? Он что - не из подсеток Гугла приходил? А как опознали?

Просто распознал - в логах он честно подписывается GOOGLEBOT.

его IP - 64.68.82.*

если даже не 64.68.*.*

Да ещё прогнал базу счётчика (у нас свой счётчик для сайтов, мной написанный - он там до чёрта всяких данных о сессии собирает. Практически, аналог спайлога - только свой и база у себя. Любой анализ посещений сделать можно) по специальному алгоритму.

Идея алгоритма проста, как валенок: во-первых, практически все роботы ходят по 1 странице за сессию (достоверно установлено всё по тем же логам), во-вторых, ходят "пакетом" (т.е. подряд просматривают несколько страниц - иногда даже все подряд, с интервалом захода не более 10 секунд), да и время просмотра страницы - считанные секунды. Сопрягаем всё это в скрипте - и пожалуйста. Но, к сожалению, этого недостаточно, да и не факт, что какой-то робот станет ходить как простой посетитель - по нескольку страниц за одну сессию.

Можно

<--include file="links.htm"-->

Всем привет!

Снова я. 😎

Всё продолжаю ковыряться с разного рода поисковиками, роботами, каталогами и т.п.

Вот, попалось, пока гугл ковырял:

http://www.google.com/search?q=cache:9JPmB4SSBtQJ:<URL>+<строка запроса>&hl=ru&ie=UTF-8

Ну понятно, URL и строку запроса я не привожу - они не важны. 🚬

Вопрос в другом - хвост этой строки - явно настройки кодировки (последовательности). Кто-нибудь их синтаксис знает? Мне моего робота-анализатора научить надо :)

Как писал Zhelengowsky
конечно, не вопрос дипломника, но всё же - как правильно прописывается этот "Last Modified"? Он прописывается в теле HTML страницы? Нужно как-то исправлять самому дату всякий раз, когда правишь эту страничку?

заранее благодарен за консультацию. Просто я не придавал значения этому вопросу раньше. Наверное, многое упускаю..

В статических сайтах:

1) в свойствах сайта на сервере добавить свойство "Last-Modified", его значение установить (вручную) в формате любой приемлемой строки, например "09.10.2003 13:00 MSK"

2) В заголовке HTML:

<HTML>

<HEAD>

....

<META HTTP-EQUIV="Last-Modified" content="09.10.2003 13:00 MSK">

...

</HEAD>

...

</HTML>

В динамических сайтах

ASP:

<%

var data=new Data();

Response.AddHeader ("Last-Modified",""+data);

...

%>

<HTML>

<HEAD>

....

<META HTTP-EQUIV="Last-Modified" content="<%=data%>">

...

</HEAD>

...

(или вывести через Response.Write("<meta http-equiv=....")

PHP:

<?php

header('Last-Modified: '+date("F d Y H:i:s.", getlastmod()));

?>

(по PHP см. также http://php.rinet.ru/manual/en/function.getlastmod.php )

Успехов!

не вредно сделать 2 вещи:

1) на сервере:

Прописать параметр Content-Type в значение windows-1251.

Неплохо бы и дату последнего изменения Last-Modified прописать; если сайт управляемый (ASP, PHP и т.п.) - то можно передать параметр на сервер.

2) В коде в <head>:

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">

Как писал LiM

У меня в лог-анализаторе такие конструкции без проблем раскодитурются всего парой простых функций: urldecode() и koi2win(). Не понимаю, почему у Вас возникли проблемы.

Спасибо, но забыл сказать - ASP (language=Javascript) & MS-SQL-Server-2000

Был бы php - я бы так не мучался, но noblesse oblige ...

:(

Как писал Polite Moose


Так называемая 7-и битная кодировка. Распознано программой TCODE, которой я пользуюсь, и которая мне очень нравится. Удобная.

Ок, спасибо. Но проблема в том, что все обработтчики я пишу сам - типа UDF (User defined function), бОльшая часть - непосредственно на уровне запроса в SQL. Подскажите, где взять таблицы кодировок. 😎

Или старым дедовским способом вбить алфавит и гонять штирлицем? 🚬

А не пробовали собственные заходы отключить в хотлоге?

И всё-таки... Кто-нибудь знает, что за кодировка применяется на 2 и далее страницах поиска яндекса?

Подстрока выглядит так: "qs=text%3D%25C4%25C1%25CA%25D7%25C9%25CE%25C7%2B%25CE%25C1%2B%25ED%25C1%25CC%25D8%25D4%25C5%26tb%3D1"

находим слово 'qs=', преобразуем получившееся в "text=%C4%C1%CA%D7%C9%CE%C7+%CE%C1+%ED%C1%CC%D8%D4%C5&tb=1", и вот отсюда я так и не могу найти кодировку (начальный запрос - "дайвинг на Мальте")

12 3
Всего: 22