Список того, что вы привели, довольно зыбкий и ограниченный, так что сравнение вполне уместно.
- hot-swap - когда все раскидано по нескольким серверам, hot-swap не настолько критичен, хотя конечно удобен
- редундантные блоки питания - то же самое, плюс сервера можно разнести по разным дата-центрам для надежности
- редундантное подключение к сети - у Хетцнера тоже заявлено Redundant Network
Преимущество этой одной большой машинки в том, что ее проще администрировать. Ну тут уже дело в цене, за такие деньги можно постоянного админа нанять.
PX120-SSD (полностью серверное железо) в Хетцнере стоит 117 евро.
- RAM 128 ГБ ECC
- 6 ядер E5-1650 v2
- 2 x 240 SSD
Если купить 10 таких машин, то получим:
- RAM 1280 ГБ
- 60 ядер
- 20 x 240 SSD
Намного мощнее железо плюс 700-800 евро остается еще на администрирование.
Этот набор машин отстанет разве только в bandwidth (10x200Mbit против 4x1Gbit)
Сервер от online.net не выдерживает ценовой конкуренции.
На EX все хорошо с SSD - можно на него переходить (предварительно протестив). Можно даже на PX, если для вашего софта подойдет.
Спасибо, мне пока не к спеху.
После замены дисков зависания продолжаются.
Если ставить интелы в PX, то придется платить flexi-pack + 2 диска.
Похоже переход на PX не удался, откачусь на EX.
Написал тикет, уже заменили.
Посмотрим, что получится.
Нагрузка неравномерная, видимо потому что только 1 диск глючил.
Лог зависания сервера:
Постоянно работал бекграунде iostat -txm 5
12/19/2013 02:03:00 AM avg-cpu: %user %nice %system %iowait %steal %idle 46.23 0.00 4.36 0.73 0.00 48.68 Device: rrqm/s wrqm/s r/s w/s rMB/s wMB/s avgrq-sz avgqu-sz await r_await w_await svctm %util sdb 0.00 76.80 3.40 23.40 0.07 1.19 96.06 0.04 1.49 0.94 1.57 1.40 3.76 sda 0.00 76.80 160.80 23.40 4.86 1.19 67.25 0.07 0.40 0.23 1.57 0.37 6.80 md1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 md0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 md2 0.00 0.00 164.20 96.20 4.92 1.19 48.07 0.00 0.00 0.00 0.00 0.00 0.00 12/19/2013 02:03:05 AM avg-cpu: %user %nice %system %iowait %steal %idle 42.99 0.00 6.41 4.23 0.00 46.36 Device: rrqm/s wrqm/s r/s w/s rMB/s wMB/s avgrq-sz avgqu-sz await r_await w_await svctm %util sdb 0.80 83.80 114.40 22.00 6.64 0.82 112.06 0.07 0.53 0.34 1.56 0.46 6.32 sda 6.60 83.80 1600.80 22.00 190.05 0.82 240.89 0.81 0.50 0.48 1.82 0.30 47.92 md1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 md0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 md2 0.00 0.00 1723.00 102.00 196.75 0.82 221.71 0.00 0.00 0.00 0.00 0.00 0.00 12/19/2013 02:03:10 AM avg-cpu: %user %nice %system %iowait %steal %idle 19.22 0.00 5.87 22.05 0.00 52.86 Device: rrqm/s wrqm/s r/s w/s rMB/s wMB/s avgrq-sz avgqu-sz await r_await w_await svctm %util sdb 0.80 53.60 120.80 208.80 8.51 58.81 418.32 43.32 91.65 11.21 138.18 1.75 57.52 sda 7.00 53.60 1199.20 230.00 144.61 69.11 306.26 34.58 24.19 1.00 145.13 0.58 82.80 md1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 md0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 md2 0.00 0.00 1327.40 281.40 153.07 69.11 282.84 0.00 0.00 0.00 0.00 0.00 0.00 12/19/2013 02:03:15 AM avg-cpu: %user %nice %system %iowait %steal %idle 16.23 0.00 1.48 24.69 0.00 57.60 Device: rrqm/s wrqm/s r/s w/s rMB/s wMB/s avgrq-sz avgqu-sz await r_await w_await svctm %util sdb 0.00 13.60 0.20 125.00 0.01 61.47 1005.64 95.30 808.50 20.00 809.76 7.99 100.00 sda 3.80 13.60 259.00 106.80 17.83 51.41 387.66 22.91 62.62 5.82 200.37 1.46 53.52 md1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 md0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 md2 0.00 0.00 265.00 120.40 17.84 51.41 367.98 0.00 0.00 0.00 0.00 0.00 0.00 12/19/2013 02:03:20 AM avg-cpu: %user %nice %system %iowait %steal %idle 22.53 0.00 2.77 19.71 0.00 55.00 Device: rrqm/s wrqm/s r/s w/s rMB/s wMB/s avgrq-sz avgqu-sz await r_await w_await svctm %util sdb 0.40 108.20 21.00 151.20 1.30 53.58 652.73 82.79 522.58 6.78 594.22 4.99 86.00 sda 6.20 108.20 411.20 148.20 40.68 53.35 344.25 16.04 28.68 2.34 101.76 1.09 60.80 md1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 md0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 md2 0.00 0.00 438.80 256.20 41.98 53.35 280.91 0.00 0.00 0.00 0.00 0.00 0.00
Активность на ssd вдруг скачет до 190M/s, через несколько секунд await возрастает до сотен миллисекунд, а потом iostat перестает писать в лог.
После перезагрузки идет resync soft raid'a.
md2 : active raid1 sdb3[1] sda3[0]
465046208 blocks super 1.2 [2/2] [UU]
[>....................] resync = 0.2% (1198464/465046208) finish=7487.4min speed=1032K/sec
В системных логах ничего нет.
P.S.
Кстати, какой у вас Wear_Leveling_Count?
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 9 Power_On_Hours 0x0032 099 099 000 Old_age Always - 492 177 Wear_Leveling_Count 0x0013 099 099 005 Pre-fail Always - 35
За 492 часа 35 это похоже ненормально.
У меня такое на PX70-SSD. Зависание происходит при запуске определенной программы - но не всегда.
У вас вообще ничего не запущено на сервере?
Вот ваше сообщение:
А теперь ВЫ его сами прочитайте, и найдите упоминание "HDD", "5400 rpm", "риковери и отформатированного пустого диска".
Еще раз повторю: если iostat показывает нормальный average wait, то проблема не в железе.
А вы не в курсе, что у SSD интерфейс SATA? Выражайтесь грамотнее, чтобы вас понимали.
Сравнивать PX70 SSD с EX4 HDD - это просто смех. У вас скорее всего софтварные проблемы на сервере, раз вы не видите проблем в iostat.
iostat -xm 5
Там смотрим await r_await w_await, если эти цифры не скачут, значит проблема НЕ в железе.