Е-детектив: Бот не оставляет следов...

12
АЖ
На сайте с 04.06.2004
Offline
4
983

У меня два вопроса, уважаемые коллеги!

1)Смотрела свой лог-файл с сервера... запись "Yandex" встречается там только два раза, да и то в прошлом году .... хотя я уже много работала со своим сайтом, обновляла содержание и т.п. В поиске содержание-description показывается новое... Всё выглядит так, будто сайт просматривается роботом, но в логах записей на этот счёт нет..

Строки выглядят как:

[03/Apr/2003:19:35:34 +0400] "GET /cgi/stat/sts.cgi?y=2003&m=04&d=03&url=http://www.yandex.ru&ips=1 HTTP/1.1" 200 1702

Понятно, что это не бот... И почему у меня только две записи с яндекса за всё это время (Хотлог и прочие счётчики отмечают такие заходы... их гораздо больше чем 2)

2) Что, собственно называется "индексацией"? Понятно, что это в первую очередь регистрация сайта (т.е. учёт всех его страниц и содержания). И бывает ли индексация ссылок (на этот сайт)?

http://www.tura-tm.ru/
A
На сайте с 23.10.2003
Offline
196
#1

Скорее всего в лог-файлы не пишется поле User-Agent. Поэтому по слову "Yandex" не определишь. Вот пример как должно быть:

213.180.210.1 - - [08/Jun/2004:07:42:55 -0700] "GET /robots.txt HTTP/1.1" 200 33 "-" "Yandex/1.01.001 (compatible; Win16; I)"

Посмотрите запросы по IP адресу 213.180.210.1, они у вас определенно есть. Например 14-ого мая 2004 :)

андроид ТВ (http://qway.com.ua/android_tv) и экшн камеры (qway.com.ua/action-cameras) в Украине.
АЖ
На сайте с 04.06.2004
Offline
4
#2
Как писал absolut


Посмотрите запросы по IP адресу 213.180.210.1, они у вас определенно есть. Например 14-ого мая 2004 :)

Спасибо, я нашла такую запись... но как мне определить индексный ли это бот или какой другой (насколько я начиталась на этом и других форумах.. боты могут специализироваться на разных функциях)? И вообще где люди берут списки всех IP-адресов яндексных и прочих ботов?

P.S. Хитро вы как-то улыбаетесь 😕 откуда вы узнали про такие мои! запросы? Попробовала проследить ваши "пути"... обратилась к открытой статистике хотлога, но там этого айпишника за это число не оказалось почему-то...Как вы это проделали?

A
На сайте с 23.10.2003
Offline
196
#3

Я полагаю не стоит ломать себе голову с типами ботов. Неужели Вам будет легче когда узнаете, что в 13:01 к вам зашел msnbot/0.11, а в 13:02 зашел "Yandex/1.01.001 (compatible; Win16; P)"? :)

K
На сайте с 31.01.2001
Offline
737
#4

Анна, роботы не берут картинки, поэтому вы их не увидите в статистике хотлога и других счетчиков. Их легко идентифицировать по User-Agent. Можно также смотреть IP-адреса, но это уже лишнее.

Сомневаюсь, что за полгода Яндекс ни разу не зашел. Ищите строки

Yandex/

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
C
На сайте с 19.09.2001
Offline
120
#5

Анна Жю, надо в настройках Апача определить формат лог-файлов, как combined, тогда в логах будут сохраняться User-agent, по ним можно будет смотреть за посещениями роботов.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
АЖ
На сайте с 04.06.2004
Offline
4
#6
Как писал Kost
Анна, роботы не берут картинки, поэтому вы их не увидите в статистике хотлога и других счетчиков. Их легко идентифицировать по User-Agent. Можно также смотреть IP-адреса, но это уже лишнее.
Сомневаюсь, что за полгода Яндекс ни разу не зашел. Ищите строки
Yandex/

Он, конечно, заходил, иначе бы мои изменённые страницы не индексировались! Мне уже объяснил "вышестоящий" товарищ, что дело в настройках лог-файла... слова Yandex там действительно нет, зато есть яндексовские IP-адреса.. правда не все его адреса я знаю.. Прийдётся ставить Апача... Меня другая проблема сейчас беспокоит: Почему вот уже больше трёх-пяти месяцев внешние ссылки на мой сайт не учитываются? Валяются в списке ИЦ ссылки древние какие-то.

АЖ
На сайте с 04.06.2004
Offline
4
#7
Как писал absolut
Я полагаю не стоит ломать себе голову с типами ботов. Неужели Вам будет легче когда узнаете, что в 13:01 к вам зашел msnbot/0.11, а в 13:02 зашел "Yandex/1.01.001 (compatible; Win16; P)"? :)

А как иначе узнать дату индексации?!

P.S. Не вежливо уходить от вопросов о том, каким образом Вам стали извесны мои логи..:( Нехорошо маленьких обижать 🙅

:)

A
На сайте с 23.10.2003
Offline
196
#8
Как писал Анна Жю
P.S. Не вежливо уходить от вопросов о том, каким образом Вам стали извесны мои логи..:( Нехорошо маленьких обижать 🙅
:)

Я ведь Вам вчера послал личное сообщение :)

АЖ
На сайте с 04.06.2004
Offline
4
#9
Как писал Cherny
Анна Жю, надо в настройках Апача определить формат лог-файлов, как combined, тогда в логах будут сохраняться User-agent, по ним можно будет смотреть за посещениями роботов.

Всегда приятно, когда незнакомые люди бывают отзывчивы к чужим проблемам :) Спасибо вам большое за совет и советы..

Скачала вот программу GREP.. она для этих целей не подойдёт?

K
На сайте с 31.01.2001
Offline
737
#10

grep - это самое оно, если у вас есть сами логи.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий