Покажите мне ваш код, я посмотрю на размер ваших функций - Администрирование серверов

Анализатор логов ddosViewer вебсервера для поиска ддос флуда

zexis · 2011-01-15T11:27:52.0000000Z

Предлагаю вашему вниманию анализатор логов ddosViewer вебсервера для поиска HTTP флуда в логах access.log Ранее я не встречал удобного анализатора логов для поиска ддос ботов. Поэтому мной был написан этот анализатор. Я его считаю удобным, так как он позволяет быстро найти флудящие IP адреса, атакуемые страницы сайта, используемые ботами юзерагенты и реферреры. А также получить статистику по легитимному трафику сайта. Программа ddosViewer создает отчеты, предназначенные для просмотра человеком. В течении 1-2 недель постараюсь написать документацию на другую мою программу -ddosHunter, которая в автоматическом режиме находит в логах IP, превысившие различные индивидуальные и групповые лимиты на количество кликов, и заносит их в фаервол. Последнюю документацию и исходный код можно скачать здесь. http://ddosviewer.narod.ru/ Мне было бы интересно услышать ваши отзывы и замечания по анализатору ddosViewer. Какие аналогичные инструменты используете для поиска HTTP-флуда? Насколько они вам удобны?

388

zexis

15 января 2011, 20:54

#11

Boris A Dolgov, благодарю за интересные замечания по существу.

Boris A Dolgov:

Излишние комментарии, комментарии по-русски

Комментариев в коде много не бывает. Делать комментарии по русски некто не запрещает.

Boris A Dolgov:

Функции по несколько экранов, принимающие десяток параметров

Да, это минус. Большие функции сложнее отлаживать. И в них больше вероятность ошибок. Покажите мне ваш код, я посмотрю на размер ваших функций.

Boris A Dolgov:

ОЧЕНЬ странные места вроде inArray_str

Посмотрел эту функцию в коде. Она негде не вызывается и не используется. Это не доделанная до конца функция. Эта функция не была отлажена и содержит явную ошибку (использование не инициализированной переменной n). Убрал из текста программы эту не используемую функцию, что бы не смущала.

Программа переделывалась, дополнялась и отлаживалась мной около полугода. Очень много тестировалась. В ней было обнаружено и исправлено много ошибок. Были ошибки очень грубые и критические. Сейчас (после 6 месяцев активного использования) вероятность ошибок в программе не высока.

Главное что программа делает, то что заявлено в ее описании.

А именно строит отчеты и на мой взляд весьма информативные.

zexis добавил 16.01.2011 в 00:37

myhand:

Так я тоже могу :-)

time tail -130000 access.log |cut -d " " -f2|uniq -c|sort -n|tail -1000

...

real    0m0.934s

user    0m0.852s

sys     0m0.080s

Тормозной Ваш парсер, вот что сударь...

Ваш скрипт лишь находит самые активные IP и выводит из отсортированные по количеству кликов.

К тому же в нем по моему 2 ошибки. (выделил их цветом)

Может вы так хотели написать?

time tail -130000 access.log |cut -d " " –f1|sort||uniq -c|sort -n|tail -1000

В моем анализаторе IP не только сортируются по количеству кликов, но еще для каждого IP рассчитывается много дополнительных данных:

Топ IP адресов

Топ IP адресов, с подсчетом интенсивности кликов

Защищаемся от http-DDoS на Борьбя с DDOS на Запрет в htaccess на

215

Boris A Dolgov

16 января 2011, 11:00

#12

zexis:
Комментариев в коде много не бывает. Делать комментарии по русски некто не запрещает.

Не согласен - комментарии должны отражать идею кода и некоторые неочевидные моменты текущей реализации, а не писать, что код делает - ведь он должен быть написан так, чтобы было понятно, что он делает без комментариев :)

Да, это минус. Большие функции сложнее отлаживать. И в них больше вероятность ошибок. Покажите мне ваш код, я посмотрю на размер ваших функций.

Чаще всего руководствуются правилом "не больше 50 строк или не больше 4-5 табов перед очередным оператором. Более-менее серьезный код, увы, сейчас показать не могу.

из какого-то плагина к billmanager

Price findPrice(int priceId)

{

    for (vector<Price>::iterator p = cnf.prices.begin(); p != cnf.prices.end(); ++p)

    {

        if (p->id == priceId) return *p;

    }

    throw logic_error("No price found");

}

string getLogin(int id)

{

    auto_ptr<ResultSet> res(msql->executeQuery("SELECT username FROM vhost WHERE pid=" + boost::lexical_cast<string>(id)));

    if (res->rowsCount() != 1) throw logic_error("Not one username");

    res->next();

    return res->getString("username");



}

void processOrder(int id, bool activate)

{

    initSql();

    int realOrder = findRealOrder(id);

    Server server = findServer(realOrder);

    Price price = activate ? findPrice(findOrdPrice(id)) : findPrice(-1);

    int realUid = findUid(realOrder), myUid = findUid(id);

    if (realUid != myUid) throw logic_error("Client doesn't have this item.");

    string login = getLogin(realOrder);



    ChangeRequest r(server, price, login);

    r.process();

}

С уважением, Борис Долгов. Администрирование, дешевые лицензии ISPsystem, Parallels, cPanel, DirectAdmin, скины, SSL - ISPlicense.ru (http://www.isplicense.ru/?from=4926)

Wordpress и jquery табы Вопросы представителю Яндекса Верстка, программирование: Bitrix, Hostcms,

M

278

myhand

16 января 2011, 11:11

#13

Boris A Dolgov:
Не согласен - комментарии должны отражать идею кода и некоторые неочевидные моменты текущей реализации, а не писать, что код делает - ведь он должен быть написан так, чтобы было понятно, что он делает без комментариев :)

+1

В хорошем коде - комментариев по минимуму. Для примера советую взглянуть на исходники ядра linux (прежде всего, не драйвера - а каталоги kernel/, lib/ и т.п.). Или код апача.

Кстати, взглянуть автору настоятельно рекоммендуется. Т.к. из текста ясно, что чего-то более-менее приличного он НЕ ЧИТАЛ, как тот самый чукча...

Абонементное сопровождение серверов (Debian) Отправить личное сообщение (), написать письмо ().

Голосование. CentOS умер. АlmaLinux ТИЦ-up на досках объяв? Q: Сервер отдает 403

822

Andreyka

17 января 2011, 08:25

#14

О чем вообще спор? Уже давно бенчмарки подтвердили, что грамотно написанный парсер на Perl обгоняет остальные ЯП по скорости выполнения.

Не стоит плодить сущности без необходимости

215

Boris A Dolgov

17 января 2011, 14:38

#15

Странные бенчмарки. Либо они не умеют писать на других ЯП грамотно.

N

419

netwind

17 января 2011, 15:29

#16

Boris A Dolgov, почему бы нет для среднего кода на C и среднего же кода на PERL ?

perl компилируется в байт-код. Реализация хешей вылизана. Регулярные выражения предкомпилируемые и вылизаны в первую очередь.

Если не придираться к реализации,что действительно плохо в этой затее - запуск программы раз в минуту и анализ по моментальным счетчикам. Во-первых это означает высокую инерцию. Теоретически если атака стартует с новыми волнами ровно в первую секунду каждой минуты, она может задрючить сайт за оставшиеся 59 секунд. В идеале будет вполне достаточно N быстрых ботов для ddos продолжительностью N минут. Это совсем немного.

А во-вторых,в этом случае невозможно сформулировать четкие рамки для пользователей сайта типа "если запросов больше 10 в секунду - вас заблокируют", а только "ой, мы не знаем точно, но где то в районе 10, а может 30 запросов в секунду делать не надо".

Кнопка вызова админа ()

Анализ скорости загрузки сайта: Практическое использование текстового анализа 3 важных кликовых сигнала

M

278

myhand

17 января 2011, 16:37

#17

netwind, вот потому вся эта галиматья с парсингом лога (да еще деревянного формата) - от бедности, как правило. Надо быстро костыль - он делается в момент атаки на sh/awk/sed/perl. А как штатное решение - полностью безнадежно (разве только для тупого парсинга error.log на предмет того, чтобы послать особо ретивых на файервол). Тут совершенно другие механизмы используют, уровня расширений веб-сервера.

PS: Кстати, для апача появился не так давно mod_qos - кто-то использовал это для противодействия DDoS?

Червь Santy использует AOL Google о запуске Web Все что нужно знать

N

419

netwind

17 января 2011, 19:02

#18

myhand, ну так не ведь perl не только для костылей. Не обязательно по крону запускать.

Можно нормального демона сделать и читающего access.log и с быстрым временем реакции.

M

278

myhand

17 января 2011, 19:30

#19

netwind:
myhand, ну так не ведь perl не только для костылей. Не обязательно по крону запускать.
Можно нормального демона сделать и читающего access.log и с быстрым временем реакции.

Да меня несколько другое настораживает. Зачем это решать кого блокировать на куцом уровне парсинга лог файлов, когда самое логичное и простое - делать это с точки зрения приложения, на кое и направлен DDOS. Как нормальные люди и делают.

А уж по крону костыли там или не по крону - дело десятое.

Непонятная атака ботов на SE Ranking новый сервис Сбор ботов

215

Boris A Dolgov

17 января 2011, 19:37

#20

Я когда-то пытался писать систему, которая будет заниматься примерно этим, только более хитро.

После кучи бенчмарков выяснилось, что пытаться что-то постфактумно делать - намного сложнее и дороже - надо распарсивать лог (хотя формат я делал несколько более распарсиваемый), кроме того - осуществлять связь между результатами парсинга логов и вебсервером (либо файлами и ифами в конфиге нгинкса, либо постоянными релоадами, ничего из этого не является хорошим).

В результате появилось лёгкое fastcgi-приложение, которое на каком-либо основании решает, пропустить запрос или нет. Может быть, когда-нибудь оно заработает так, как этого хочется, но сейчас разбираться в нём приходится эпизодически, когда на какой-нибудь из знакомых проектов приходит ddos.

Но придумывание решения о пропускании оказалось нетривиальным, и всё равно пришлось писать парсирку некрасивых логов, чтобы загружать в неё логи нормальной работы сайта. На бусте получилось не больше 400 строк, что выдаёт классификации клиентов "SEO-грабилка/сапа , обычный пользователь, аномальный пользователь, и т.д." и некоторые критерии для определения классификации для конкретного сайта.

Клиентский антивирус - мысли Быстрый робот Статус: остановлена

Как удалить плохие SEO-ссылки и очистить ссылочную массу сайта

Курс биткоина превысил $50 тысяч

Анализатор логов ddosViewer вебсервера для поиска ддос флуда