http://tele-house.ru/crawler.htm

123 4
s91
На сайте с 13.04.2009
Offline
88
s91
#11
запросы делает 1 раз в секунду не чаще

Явно не один запрос в секунду :D

Но в любом случае ничего страшного. Злой IP уже в бане))

Наверное 1 раз в секунду к каждому поддомену. А если их 100 000 на одном сервере....

Если бы у меня яша так глотал страницы, наверное был бы уже миллиардером :D

Не бывает белой и черной оптимизации. Бывает только обман и разные способы его реализации
P1
На сайте с 18.05.2009
Offline
42
#12

s91 подскажи plz как его забанить

cancel
На сайте с 03.06.2009
Offline
24
#13

parabelum1, в .htaccess например


## USER IP BANNING
<Limit GET POST>
order allow,deny
deny from *IP*
allow from all
</Limit>

*IP* - ip адрес того, кому бан

тоже в бан отправил это чудо, и докучи еще 1 такого же: "OOZBOT/0.20 ( _ww.setooz.com/oozbot.html ; agentname at setooz dot_com )"

X2
На сайте с 24.08.2007
Offline
14
#14

s91, это какой-то косяк.

Пришлите плз в личку название сайта и кусок лога с урлами. Разберёмся, пофиксим.

Кстати, а сколько у вас сайтов с разными доменами на одном IP?

s91
На сайте с 13.04.2009
Offline
88
s91
#15
Пришлите плз в личку название сайта и кусок лога с урлами. Разберёмся, пофиксим.

Я уже разобрался)))

Кстати, а сколько у вас сайтов с разными доменами на одном IP?

По 300-400 доменов с поддоменами на каждом IP

Тот кусочек что я привел выше - это кусочек статистики запросов к серверу для всех доменов привязанных к нему.

xpro2004, а если не секрет, для чего собирается данная база? Я видел описание, типа поисковая система и т.д. А где она сейчас используется, или для какого проекта будет использоваться? Вы конечно не обязаны отвечать, просто интересно.

X2
На сайте с 24.08.2007
Offline
14
#16

s91, это поисковый сервис. Снаружи пока не доступен.

Всё же хотелось бы разобраться в чём у нас проблема, будем очень признательны, если таки пришлёте лог и список поддоменов. Обещаю не разглашать.

P
На сайте с 02.06.2009
Offline
14
#17

xpro2004, ну Вы и жгунишко, почему вдруг s91 должен помогать Вам в создании непонятно чего? Проще забанить.

s91
На сайте с 13.04.2009
Offline
88
s91
#18

xpro2004, в любом случае разглашать имена доменов не собираюсь.

То что я заметил, ваш робот пытается проиндексировать вплоть до 5!! уровня вложености, возможно и дальше. И это на сайтах с бесконечным количеством страниц.

Возможно это вам поможет.

0x44
На сайте с 18.07.2006
Offline
64
#19

Ваш робот пытается индексировать то, чего нет в природе... Т.е. "левые" url'ы...

Пример: /message-1.html а он пытается: /message(a-z, или цифры левые).html или search=абра кадабру впихнуть...

Надеюсь, IP в ближайшее время хотя бы Ваш бот менять не будет...

P1
На сайте с 18.05.2009
Offline
42
#20

спасибо

111

123 4

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий