Boris A Dolgov

Boris A Dolgov
Рейтинг
215
Регистрация
04.07.2007
hostplus.ws:
Во первых краеугольный камень тут - надёжность и стабильность, во вторых я упор делал в ТЗ именно на *коробочный* вариант, на любой панели можно скрутить какой угодно велосипед, вопрос в том, на сколько далеко можно уехать на этом велосипеде и на сколько этот процесс будет комфортным. Если правда в будущем добавят, что же, это будет не более чем очередной попыткой догнать лидера рынка, причём как всегда уверен в крайне кривой форме и нулевой стабильностью, сопровождаемой кучей багов и головной болью.

CL - вполне себе коробочный вариант. Как минимум два человека, которые тут отписались, точно используют его с ISPmanager, а может быть - больше.

К слову, ISPmanager научился распознавать CL в /etc/redhat-version на пару месяцев раньше cPanel :)

Boris A Dolgov добавил 10.07.2011 в 00:58

dlyanachalas:
Из топега сделал вывод, что cPanel удобен хостерам, вот они его и ставят. А ISPManager удобен клиентам (это из личного опыта, и в опросе видно), но их мнение никого не волнует.

Осюда простой вопрос - а нельзя ставить сразу две панели? Одну - админам, а другую - для пользователей.
Или тут всё в цену упирается? Вы же, господа хостеры, всё время твердите про нищесбродство клиентов. Так покажите пример хорошей траты денег на пользу дела ;)

На один сервер - нельзя. Но можно держать несколько серверов с разными панелями. Как выше написал KM.UA, это заставляет помнить в два раза больше особенностей панелек, тратить в два раза больше времени на обучение, развертывание, автоматизацию и интеграцию. И ещё иметь в два раза больше NS-серверов :)

myhand:
На мой взгляд разумно 1) оповестить клиентов в срок, что проблемой занимаются 2) определили ее источник и оценили приблизительные сроки решения. Эти этапы разумно жестко ограничивать во времени.

А обещать заранее, что починят все что угодно в 1 час - только болтуны могут. Максимальные сроки решения проблем, конечно, можно попытаться оговорить и ограничить. Да и то, только в случае ограниченного списка нештатных ситуаций (что Вы будете делать, когда райд накроется, а клиент не позаботился о бекапе на отдельный дисковый массив, несмотря на указанные ему риски?). И эти сроки в разы будут больше часа.

Клиенту нужно не знать, что кто-то работает, а решение проблемы (можете называть это маркетингом, но это действительно так).

В принципе, мы говорим примерно одно и то же -- только Вы называете это тремя этапами и разновидностями проблем, а я -- сроком решения проблемы, зависящей от админа и решением проблемы, от него не зависящей.

Наверно, при составлении договора Ваша точка зрения более правильная.

Не могу отказать Вам в праве забрать свое нормальное распределение :) Дисперсию можно поставить побольше - порядка часа и больше. Можно поточнее оценить из своего опыта. В общем, ничего сложного не должно быть - любой толковый студент сварганит более-менее разумную модельку для простой оценки.

Проинтегрировал Ваше нормальное распределение ;) При SLA в 3 часа, мат.ожидании в 2 и дисперсии в час получается 0.32Up нарушений SLA в год, где U - количетво пользователей, а p - мат. ожидание количества срабатываний мониторинга в сутки. Забавно получается -- при 10 пользователях и срабатывании раз в 3 дня получается всего 1 нарушение SLA в год.

Можно считать, что эта прикидка была правильной для фирмы администрирования.

Теперь посмотрим на администратора, который спит 6 часов в день. Это значит, что 1/4 суток он не отвечает на события мониторинга, и они нарушают SLA, и тогда количество его нарушений равно U*(1/4)*p*365! Что почти в 300 раз больше и за год сделает 300 нарушений - почти по нарушению в сутки! Получается, что фрилансер, который спит 6 часов в день, в триста раз хуже компании из двух админов, которые покрывают всё время? :)

Я понимаю, что вторая модель натянута и из-за разбужения смсками совсем неправильная, но пока очевидного способа добавить выносливость отдельного человека не вижу. Разве что посчитать, что если четыре события подряд произошли с разницей в 6 часов друг с другом, то админ не высыпается и срывает последний SLA -- в этом случае получается, что один админ в пять раз хуже команды.

Есть мнение, а есть реальный мир - в котором даже людей убивают, несмотря на законы, которыми это четко воспрещается :(

😮

hvosting:

Полносвязная репликация подразумевает что каждый ноявляется мастером и слейвом одновременно.
для 2-х машин работает точно, дописали ли для большего - не уверен, в планах было.

И часто ломает данные, если серверы не подключены друг к другу прямым шнурком :) Тоже лично сталкивался, так что для гео-нужд это не работает.

Andreyka:
Не поверишь - DA может работать с софтом точно так же как и ispmanager :)

Я даже верю, что ISPmanager может работать с софтом из исходников :) Вопрос в том, что разработчики считают стандартной политикой и для чего предоставляют инструменты из коробки и техподдержку.

hostplus.ws:
Вопрос к ярым сторонникам продуктов ISP. Как средствами ISP Manager реализовать назначение лимитов использования ЦПУ/ОЗУ/кол-во процессов для аккаунтов шаред хостинга, да ещё так, чтоб каждый клиент получал в формате графиков и таблиц с данными отчёты о РЕАЛЬНОМ использовании ресурсов сервера? Все носятся с так называемыми лимитами нагрузки, при том, что на базе ISP Manager её толком нельзя ни контролировать, ни ограничивать, ни тем более показывать всё в визуально читаемом виде для клиента, так чтоб ему стало понятно, когда и какие лимиты он превысил (причём в моём ТЗ он ничего превысить как раз не сможет, ТЗ предполагает фактически VPS хостинг, только для клиентов шаред хостинга), слабо такое реализовать, да ещё так, чтоб это было частью самой панели и делалось всё полностью через панель? А в cPanel/WHM это базовая ф-ция с недавних пор и таких примеров можно перечислить сотнями (причём, что важно, все эти примеры будут работать исключительно надёжно и стабильно, в отличии от ISP)

В след. релизе ISPmanager обещали поддержку bsd acct из коробки. Моментальное использование, конечно, не получится, но вот среднее за последние 5/15 минут -- легко.

Или ставьте CloudLinux, который всё это сам делает и к которому скоро появится isp-плагин. (кстати, у меня есть подозрения, что в Вашем ТЗ Вы как раз и говорили о нём).

myhand:
Это достаточно строго и понятно - фуфло.

Отреагировать на событие - да. Локализовать проблему - весьма вероятно. Решить - вероятно нет. И от количества администраторов в команде это не сильно зависит, увы (Вы даже пример выше привели).

Потому и нужны SLA, в которых оговариваются сроки прежде всего 1) и 2), да и 3) - тоже. Причем сроки 3) могут в разы разниться, по сравнению с 1) и 2), в зависимости от характера проблемы.

Не совсем понял, что Вы имеете ввиду. Я, вроде бы, оговорил сроки решения администраторской проблемы, а сколько времени из него они будут спать, а сколько -- локализовывать -- это уже их проблемы.

myhand:
А это причем здесь? Речь ведь шла о гораздо более простой ситуации: скажем у Вас есть два совершенно независимых клиента, в разных ДЦ, разное оборудование. Вы оговорили одинаковое SLA для них - какова вероятность того, что проблемы у них возникнут одновременно и работа над одной будет мешать выполнению условий SLA для другого? Как это зависит от условий SLA? А если у Вас 10 клиентов? А если 100?

Если Вы дадите мне распределение времени решения проблемы, которая у каждого пользователя возникает в единичный промежуток времени, то я, наверно, смогу посчитать матожидание количества нарушенных SLA за указанный период в зависимости от количества пользователей. Я не считаю это распределение тривиальным, но можно попробовать взять что-нибудь с большим пиком в нуле и нормальным распределением с пиком в 30 минутах дальше.

Однако, есть мнение, что количество невыполненых SLA должно стремиться к нулю :)

Boris A Dolgov добавил 09.07.2011 в 21:49

Andreyka:
Сервер можно подоготовить к школьному DDOS, поставить raid для защиты от краха жесткого диска. Да и дата-центры не умирают каждый месяц.

Сами поедете ставить RAID клиенту? :)

Можно ли просуммировать Ваше мнение как "мониторинг не нужен, потому что все его события предусматриваются заранее"? В принципе, логично, но сервера почему-то падают.

myhand:
"Угадать" - не надо. Надо математику немного знать, после чего моделирование подобных ситуаций и конкретные оценки - для Вас не составят труда.

Предложите какую-нибудь тривиальную модель и посчитайте в её рамках вероятность этого события.

Disclaimer: я ни в коем случае не наезжаю на математику, а лишь хочу сказать, что для получения адекватных результатов нужно строить весьма сложные модели, а смысла в этом особого нет -- ведь мы не на атомной станции работаем.

myhand:
"Логично" будет конкретное требование по "стабильности и надежности" - выраженное в xxx минутах/часах допустимого простоя yyy раз в месяц, скажем. А Ваша логика категорически не годится для перевода в конкретную денюжку: "стабильно и надежно" без цифирок - это просто маркетинг.

Мы сейчас договор составляем или обсуждаем фактический состав услуги администрирования? Клиент хочет именно стабильности и надежности, а получает их гарантию в устраиваевующем его объеме с помощью всяких SLA и гарантий аптайма.

Хотя, я считаю определение "отреагировать на падение сервера/сервиса в течении часа в любое время решением проблемы либо сообщением о том, что она находится на более высоком уровне (датацентра или оборудования)" достаточно строгим и понятным.

Andreyka:
А я считаю, что если сервер настроить грамотно и заходить раз в месяц, то этого вполне достаточно, чтоб избежать разных внештатных ситуаций, падений и смсок.

Как сервер не настроишь, это не спасёт от падения датацентра, DDoS-атаки, краха жесткого диска или ещё чего-нибудь, что требует время на выяснение причин падения.

myhand:

А с чего Вы решили, что человеку, который готовится заплатить 50-150$/мес (см. разведку цен в начале топика) - в действительности нужен этот самый "не превышающий часа" срок?

Проекту, которому действительно нужна оперативная поддержка - несложно заплатить куда больше... А если кто-то обещает всем подряд подобные сроки реакции за 20$ в месяц - это полностью проблемы обещающего.

Потому что я знаю сторонние фирмы, которые предоставляют указанный часовой срок реакции за эти деньги, и весьма логично, что если проект переезжает на сервер, то ему нужны стабильность и надёжность работы.

Boris A Dolgov добавил 09.07.2011 в 18:48

myhand:

Ну дык, наверно, не постоянно звонят. А если таки настолько достали, что каждую ночь звонят - наверно чересчур "одмин" переусердствовал с числом своих клиентов по тарифам "за еду", нет? И/или попросту выполняет работу плохо.

С риском, что администратор "заболеет" (например, его трамвай переедет - с летальным исходом) - это Вы верно заметили. Если хотите застраховаться от такого форс-мажора: оговаривайте например как-то документирование работы администратором, чтобы всегда, в принципе, можно было сменить работника.

Увы, предугадать количество звонков и их время почти невозможно - и из-за этого есть возможность не уложиться в указанный срок.

Именно поэтому я считаю, что при работе с частным админом нельзя оперировать понятием "реакция в течении часа 24/7", а можно оперировать только понятием "сделаю когда смогу, но постараюсь почти всегда примерно за час".

Boris A Dolgov добавил 09.07.2011 в 18:49

Raistlin:
Boris A Dolgov, Вы набираете столько сколько берут, или вы набираете столько серверов, сколько можете вести в нормальном режиме?

Я не набираю серверы, потому что считаю, что мой сон и отдых стоят дороже, чем за него готовы заплатить большинство заказчиков :)

Всего: 2623