Зачем сканируют сайт?

12
Dynamics
На сайте с 28.10.2010
Offline
13
2030

На сайт зашел посетитель и начал сканировать все страницы, по несколько в минуту, иногда останавливаясь. JoomlaWatch зафиксировал посетителя, как человека, а не бота. IP сканировавшего 212.158.161.214. Зачем и кому могло понадобиться сканировать сайт?

Системы вибродиагностики промышленного оборудования (http://www.dynamics.ru)
Q
На сайте с 30.11.2010
Offline
5
#1

может весь сайт себе хотел сохранить прогой типа Teleport Pro

zexis
На сайте с 09.08.2005
Offline
388
#2

Такое бывает часто. У крупных сайтов почти каждый день.

Делают это:

1) Хакеры ищущие уязвимости или определенные скрипты на сайте.

2) Желающие скачать сайт или изучить его структуру.

anser06
На сайте с 11.03.2006
Offline
292
#3

Желающие сохранить ценный сайт для истории, если тот вдруг накроется 😂

EEM
На сайте с 07.06.2007
Offline
79
EEM
#4

Наверное в таких случаях тоже следует поискать уязвимые места...

Dynamics
На сайте с 28.10.2010
Offline
13
#5

Успел четверть страниц просканировать, но потом я его забанила :)

Теперь не знаю, что от него ожидать, никто ему не помешает с другого айпи вылезти.

А нет никаких защит от таких прог, типа Teleport Pro?

D
На сайте с 24.01.2011
Offline
3
#6
anser06:
Желающие сохранить ценный сайт для истории, если тот вдруг накроется 😂

Почему бы и не сохранить :D, если уж сайт серьезный.

dokxpi добавил 01.02.2011 в 08:15

anser06:
Желающие сохранить ценный сайт для истории, если тот вдруг накроется 😂

Дополнение архива - WikipediaLokalhost :D

ICANN аккредитованный регистратор доменных имен (http://ukrnames.com/?ref_id=7103) | Whois (http://dig.ua) | Помощь (http://support.ukrnames.com) |
L
На сайте с 07.12.2007
Offline
351
#7
Dynamics:
А нет никаких защит от таких прог, типа Teleport Pro?

Есть, попробуйте, например, статистику Рамблера попарсить.

Обычно ограничивается кол-во запросов в единицу времени (с одного IP/UserAgent/Cookie).

Только о посетителях не забывайте - у меня чуть не матом ругались, когда были слишком жеские ограничения. Не ленились, пис`али на Email и распекали так, что аж стыдно было.

Зачем сканируют - каждый за своим.

Кто-то внешние ссылки собирает, кто-то ключевики, кто-то дубли ищет и битые страницы (в основном сами вебмастера, но иногда я чьи-нибудь сайты проверяю своим пауком).

Кто-то - вирусы на сайте ищет, есть и такие "доброхоты". Кто-то авторский контент или распространение нелицензионного ПО.

Сейчас армию своих роботов-пауков может сделать каждый.

zexis
На сайте с 09.08.2005
Offline
388
#8

Есть отлаженный анализатор логов, который ставит ограничение на количество запросов с одного IP. Заодно обнаруживает ддос атаки HTTP флуд.

Обнаруженные IP автоматически заносит в фаервол.

Установка 100$.

Dynamics
На сайте с 28.10.2010
Offline
13
#9
dokxpi:
Почему бы и не сохранить :D, если уж сайт серьезный.

Да я и без них себе на localhost сохраню, спасибо им за беспокойство :D

Самое интересное, что ни один счетчик не зафиксировал, что четверть сайта была скачана, статистика везде показывает просмотры страниц без учета работы этого бота.

zexis
На сайте с 09.08.2005
Offline
388
#10
Dynamics:

Самое интересное, что ни один счетчик не зафиксировал, что четверть сайта была скачана, статистика везде показывает просмотры страниц без учета работы этого бота.

Вы про счетчик ливеинтрнет?

Боты не вызывают счетчик. Поэтому он их не видит.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий