ISPmanager: срыв стэка. Еще один сюрприз от ISP?

Boris A Dolgov
На сайте с 04.07.2007
Offline
215
#41

Кроссплатформенно - это когда волшебные числа берутся из заголовков :)

С уважением, Борис Долгов. Администрирование, дешевые лицензии ISPsystem, Parallels, cPanel, DirectAdmin, скины, SSL - ISPlicense.ru (http://www.isplicense.ru/?from=4926)
bugsmoran
На сайте с 18.02.2010
Offline
223
#42
netwind:
bugsmoran
а где же в патче

?

Не в этом патче. Блин, короче все объясняю заново, что происходит в треде. Есть ядро. В нем куча доработок ради устойчивости системы. Какие конкретно я говорить не буду - это коммерческая тайна. Но в том числе контроллер io-throttle и другой шедулер BFQ, которые не временем отмеряет очереди запросов как CFQ, а количеством считанных секторов с диска. То есть один клиент не может себе забрать весь ввод-вывод и тем самым положить систему. То есть CFQ это тоже может, но вот там есть другая архитектурная проблема - с асинхронными I/O. Ну не суть. Одна из доработок - патч на бэкапную систему. Так как сервер рассчитан не несколько тысяч среднестатистических сайтов (что очень много), а каждый сайт - это сотни файлов, то получаем получится 1-3 млн. файлов на файловой системе. Делать каждый день полный бэкап - дорого удовольствие, а потому вынуждены делать инкрементальный. Так как скрипт должен сделать stat каждому файлу из этих 1-2 миллионов, на предмет "изменялся ли ты сегодня?", то это дикая нагрузка на файловую систему. Это не только расходует ресурс диска, но еще и затормаживает работу сайтов. Именно для этого применили патч, что каждый раз ядро само сообщает какой сайт изменился и складывает эту информацию отдельно. А бэкапный скрипт, который ночью запустится, уже заранее будет знать, что бэкапить.

Упоминание кучи доработок было не в контексте темы топика, а в контексте отбивания от троллей. Но на самом деле они не касаются этой проблемы с кернел паник.

Boris A Dolgov
На сайте с 04.07.2007
Offline
215
#43
bugsmoran:
Ну так клиент же не знает об этом. 4 сборки = 4 тестирования, но не 4 выката на продакшен. На продакшен дай Бог каждое 20-е или 30-е ядро попадает. Сейчас уже конечно не 4 за ночь. Почти всего, что нужно добились. Вот только баг неприятный всплыл, но уже он закрыт.

Ну всё равно получается минимум - ребут в месяц. Это заведомые 5 минут дауна в месяц, что достаточно плохо.

Плюс, скорее всего, при тестировании на продакшене вылезет что-то достаточно нехорошее, что потребует ещё 5 минут перезагрузки.

Осознание этого в основном и останавливает от использования подобных фич на более-менее серьезном проекте. Хотя, может быть, начальство когда-нибудь созреет до необходимости инноваций.

bugsmoran
На сайте с 18.02.2010
Offline
223
#44
Boris A Dolgov:
Ну всё равно получается минимум - ребут в месяц. Это заведомые 5 минут дауна в месяц, что достаточно плохо.

Ну это же не просто 5 минут даунтайма в месяц, а 5 минут ночного даунтайма во избежании ежедневных дневных 5 минут даунтайма. То есть все равно экономия очевидна. А если учесть, что плохое открывание сайта даунтаймом не считается, но объективно им является, то вообще часы экономии. А если еще и добавить, что ядра все реже и реже меняются, а обычные хостинги продолжают падать с завидной постоянностью...

Нет, я уверен, что это правильная стратегия :)

N
На сайте с 06.05.2007
Offline
419
#45

bugsmoran, так а по какой лицензии основной патч от bluehost (тоже мне тайна, на первой странице бложика написана) распространяется? может его кто-то уже выложил? gpl ведь этому не препятствует.

все же, ошибки более вероятны в том большом патче, чем в этом маленьком для бекапа.

Кнопка вызова админа ()
bugsmoran
На сайте с 18.02.2010
Offline
223
#46
netwind:
bugsmoran, так а по какой лицензии основной патч от bluehost (тоже мне тайна, на первой странице бложика написана) распространяется? может его кто-то уже выложил? gpl ведь этому не препятствует.

Какая нафиг лицензия? Добрый человек написал, поделился с пацанами. Ему решать нужна лицензия или тупо выкинуть в сеть и делайте что хотите. Можете залицензировать первые, еще успеваете ))))

netwind:

все же, ошибки более вероятны в том большом патче, чем в этом маленьком для бекапа.

Уже найдена ошибка. Она была именно в этом маленьком патче на бэкапы. Заключается в неверной конкатенации строк. Вместо длины второй составляющей указали ее объем в памяти. Причем это не ошибка Блухоста, а ошибка нашей переделки этого патча.

N
На сайте с 06.05.2007
Offline
419
#47

bugsmoran, какой-то он не до конца добрый, раз не выложил.

If you are interested in licensing it or testing it out (Must be at least 10 servers or more if you want to test it out before buying at this time) then please email me directly with your contact information at matt@bluehost.com.

с патчем на бекап наконец-то все понятно.

Andreyka
На сайте с 19.02.2005
Offline
822
#48
WhiteSuite:

Там целый комплекс доработок от io-throttle до BFQ. Сервер просто нереально перегрузить насильно. Форк-бомбы тоже не работают.

Ну вот и причина для ошибки ядра.

На моем ядре, с повышенной безопасностью, ISP тоже не захотел идти, пока ему не дал право на запуск в сегменте стека. Без этого он выпадал в кору, но на систему конечно же не влиял.

А если он так влияет на ядро, то стоит дважды подумать об использовании этих доработок, если удалось выбить софту из юзерленда, значит это может служить точкой для локального DDOS.

Не стоит плодить сущности без необходимости
bugsmoran
На сайте с 18.02.2010
Offline
223
#49
netwind:
bugsmoran, какой-то он не до конца добрый, раз не выложил.
If you are interested in licensing it or testing it out (Must be at least 10 servers or more if you want to test it out before buying at this time) then please email me directly with your contact information at matt@bluehost.com.

А вот этот патч он и не выложил. Тут уже речь у него не про бэкапный скрипт идет. Это уже все сами делали.

Andreyka:

А если он так влияет на ядро, то стоит дважды подумать об использовании этих доработок, если удалось выбить софту из юзерленда, значит это может служить точкой для локального DDOS.

WhiteSuite нету, отвечу за него. Оно понятно. Но за неимением идей лучше, сделали так. Баг уже к середине ночи был закрыт. Надеюсь больше софт из юзерспейса так не выбьет его.

M
На сайте с 16.09.2009
Offline
278
#50
bugsmoran:
Ооооо... да Вы, уважаемый, рано в админы записались, если у Вас общая нагрузка на сервер зависит от кривости скриптов клиентов ;).

Может и раньше Вас, так что зря отмахиватесь ;-)

Но речь ведь шла в первую очередь о посещаемости сайтов. А "кривость" скриптов - просто дополнительный фактор, который усугубляет общую картину нагрузки от конкретного клиента.

А вот сознательных попыток "завалить" сервер как Вы описываете я не помню в своей практике _в принципе_. Это просто глупо. Ну упрется человек в лимиты, ну пусть даже это скажется на пару минут и для других клиентов (хотя не факт что скажется, и уж точно не приведет к недоступности сайтов у других). Так забанят его за эти самые пару минут на нагрузку. Вот и все.

bugsmoran:
Срочно на сайты кернелтрапа и редхата. Там нужные Вам технологии всплывают. На редхате вообще все описано от и до очень подробно.

Вы телепатически определили какие технологии нужны мне? Успокойтесь :) Я не лезу в Вашу нишу виртуального хостинга и с Вами конкурировать не собираюсь - школохостинги мне не интересны.

Да и патч "бекапный" пока тоже не нужен. Мы пока по-старинке, зато без паник лучше ;-)

bugsmoran:
Плакать Вы будете, когда у Вас бэкапный скрипт понесется по файловой системе в поиска измененных файлов. Вот это Вы реально плакать будете.

А я не плачу. Я вообще не замечаю этого. А что нужно сделать, чтобы заметить? Какой объем данных, число файлов, какой объем инкремента и т.п.

bugsmoran:
Ну так клиент же не знает об этом. 4 сборки = 4 тестирования

И как Вы это "тестируете"? Вон - дебиановские ядра стоят на 60k машинок только по popcon'у. Плюс, в Вашей схеме куча ребутов.

А теперь посмотрите на то, сколько человек этим там занимается. Вы уверены, что хоть близко сумеете добиться такого качества сборок в команде из пары человек?

Вопросы реторические, конечно. Я уже приблизительно представляю что Вы ответите и искренне надеюсь, что время Вас научит. Но умные люди предпочитают учиться на чужих ошибках ;-)

bugsmoran:
Надеюсь больше софт из юзерспейса так не выбьет его.

Так у Вас работоспособность софта на "надеждах" держится? Я бы еще тыщу раз подумал, прежде чем продолжать использовать патч, в работе которого Вы не разобрались полностью. Тем более, Вы говорите что у Вас куча улучшений с планировщиком I/O - ну и в чем тогда проблема перенести бекап в юзерспейс?

Абонементное сопровождение серверов (Debian) Отправить личное сообщение (), написать письмо ().

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий