Что там уже тяжело? Да даже данных с гугл аналитикс досаточно, чтобы посчитать сколько какая доступность будет стоить. Я, конечно, понимаю, что хочется, чтобы клиенты платили за воздух, не были технически грамотными и не оптимизировали затраты на серверы, но так же не бывает, мы здесь не благотворительностью занимаемся.
Ну где-то так, главное никогда не забывать, что нас интересует вероятность доступности сервера только в момент, когда придет посетитель, а не в любое время.
Причем тут аптайм? Это называется доступность, а не аптайм. И давайте не писать числа от балды. Первое что, это то что доступность считается на пользователя, а не на сервер, нам абсолютно все равно, доступен ли сервер, когда на него никто не ходит. Т.е. чем меньше пользователей, тем легче получить высокую доступность.
Формула примерно такая:
1 - секунд_простоя*одновременных_запросов_в_секунду/секунд_в_году
Теперь в случае с dns failover'ом c round-robin'ом мы получаем недоступность в виде частичного ответа тем клиентам, которые в момент падения отправили запросы. Всем остальным будут просто задержки, пока их dns не обновится.
Т.е. при 100 запросах в секунду и 2 падения в год (2 секунды недоступности):
1 - 2*100/(365*24*60*60) = 0.99999 (99.999%)
Да, те самые пять девяток. Теперь давайте посчитаем у скольких человек будет пару минут с задержками. Допустим 100 запросов в секунду это 300 человек в минуту и при 2 падениях в год - это 10 минут, если по 5 минут тормозов на падение:
1 - (10*60)*300/(365*24*60*60) = 0.994 (99.4%)
Итого: целых 99.4% без задержек и 99.999% доступности за копейки - по-моему отлично.
А если на ваш сайт ходит всего пару тысяч посетителей в сутки, то у вас будет доступность и ответы без задержек на два порядка лучше (99.99% и 99.99999%).
Аптайм не стоит ничего. Стоимость HA зависит от терпимого времени простоя. Скажем маленький простой (несколько минут ответов с задержками) можно получить очень дешево (dns failover на два сервера в разных дц, стоимость всего лишь аренда еще одного дедика в нем), а вот чуть-чуть уменьшить этот простой дальше будет стоить уже в 10-100 раз дороже.
Сервер хетзнера + такой же сервер ovh + dns failover = минуты простоя в год за 100 euro в месяц. У кого еще можно получить такую доступность с приличным сервером и почем? Облако? В лучшем случае пол дня простоя в год за 10x денег - не, не катит. Нормальная CDN (не клаудфлейр) + два сервера в разных ДЦ? Ну будет чуть лучше, чем вариант с dns failover, но и значительно дороже. Что еще остается? Своя AS + anycast со всеми вытекающими, слишком дорого.
Это ничего не дает и уж точно не может быть преимуществом облака. Хороший пример амазон, у них раз в год регулярно факапы, все их датацентры падают. Потому что это одна компания, одна AS и одни люди, которые занимаются всем во всех ДЦ и если какое-то изменение где-то приводит к проблемам, то сразу во всех ДЦ.
Резервы каналов, питания, роутеров, дисков в рейде покрывают совсем маленькую часть из того, что может случиться. Например:
- вынимали соседний сервер, перепутали, выдернули питание вашего или просто задели его, или что еще хуже, задели сетевой кабель и не заметили, пол часа простоя;
- кто-то в вашем шкафу стал дико грузить свитч, потери пакетов и деградация на пару дней;
- обнвляли роутеры и они вдруг перестали работать, пол дня простоя, у кого только не было;
- прописали правило, наткнулись на баг, все роутеры умерли, как у клаудфлейр было;
- перекинули трафик через другой роутер на время каких-нибудь работ, а он не выдержал, все площадки каскадно повалились, у амазона такое было;
- шейпер трафика стал шейпить не тот трафик, простой до того, пока утром на работу не придет человек, который занимается шейпером, техподдержка ничего сделать не может, у меня лично это было в двух разных дц;
- не поняли abuse репорт на не русском и вырубили интернет, на всякий случай, у меня было в одном дц;
- выдали не тот ip-kvm и пол дня не могли понять, почему он на левый сервер указывает, пол дня простоя, тоже у меня было;
- и т.д. и т.п.
Резервирование в том же ДЦ уже не выглядит таким нужным, не правда ли? :)
Это ваше мнение, ничем не подтвержденное. Для хранения бэкапов и потоковой информации у WD целая отдельная серия.
Потому что отказоустойчивость даже теоретически не достигается одним сервером и одним дц, как бы вы не хотели. Т.е. два дешевых сервера с фейловером всегда надежнее, чем один дорогой.
Можно даже за 10 евро с 5 ТБ трафика (ovh).
Не разводите FUD, вот, анпример, реальный живой грин, больше 3.5 лет: