Смарты дисков

1 234
M
На сайте с 16.09.2009
Offline
278
#21
devd:
Сорри что запутал фразой, на самом деле я про измерение времени создания новых блоков на диске.

А тут-то причем смарт?

devd:
Смарт тесты на том диске делаются каждый день.

Ну так и прекрасно! Вот и сменили бы диск давным давно.

devd:
Пока для себя написал скрипт который измеряет это все ночью (при отсутствии нагрузки) и подает сигнал если стало выше среднего.

Круто, конечно. Только вот результат измерения будет больше похож на шум.

Абонементное сопровождение серверов (Debian) Отправить личное сообщение (), написать письмо ().
D
На сайте с 18.10.2011
Offline
109
#22
А тут-то причем смарт?

Притом, что нужно принять решение о смене диска.

Для этого нужно собрать больше информации.

Круто, конечно. Только вот результат измерения будет больше похож на шум

Если бы это не срабатывало то зачем мне было бы это делать?

Если хочешь жить в хетцнере то и не так раскорячишься.

M
На сайте с 16.09.2009
Offline
278
#23
devd:
Притом, что нужно принять решение о смене диска.
Для этого нужно собрать больше информации.

Ну и? Лично мне для "принятия решения" в вашей выдаче вполне достаточно одного показателя. Даже для говенного терабайтника 500 ремапов - это перебор.

И к чему тут тогда ваше "непонятно зачем тогда нужен smart"?

Вы удивились почему в вас в трех последних тестах (а фактически в одном - long) не было ошибок. Вам объяснили выше. Все еще непонятно?

devd:
Если бы это не срабатывало то зачем мне было бы это делать?

Люди разные глупости делают, лично я этому не удивляюсь. Измерения - это вообще целая наука в любой науке :)

D
На сайте с 18.10.2011
Offline
109
#24
Вы удивились почему в вас в трех последних тестах (а фактически в одном - long) не было ошибок. Вам объяснили выше. Все еще непонятно?

Непонятно как можно делать далеко идущие выводы незная полного вывода.

Там все тесты за последний год успешны.

Люди разные глупости делают, лично я этому не удивляюсь.

Совсем глупо ничего не делать и верить только смарту.


SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 114 099 006 Pre-fail Always - 61107873
3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 47
5 Reallocated_Sector_Ct 0x0033 087 087 036 Pre-fail Always - 541
7 Seek_Error_Rate 0x000f 077 060 030 Pre-fail Always - 52665104
9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 8911
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 47
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 099 000 Old_age Always - 24
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 076 052 045 Old_age Always - 24 (Min/Max 22/37)
194 Temperature_Celsius 0x0022 024 048 000 Old_age Always - 24 (0 21 0 0)
195 Hardware_ECC_Recovered 0x001a 018 016 000 Old_age Always - 61107873
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 131550553318176
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 126491491
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 78508314

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 8892 -
# 2 Short offline Completed without error 00% 8868 -
# 3 Short offline Completed without error 00% 8844 -
# 4 Extended offline Completed without error 00% 8826 -
# 5 Short offline Completed without error 00% 8820 -
# 6 Short offline Completed without error 00% 8796 -
# 7 Short offline Completed without error 00% 8772 -
# 8 Short offline Completed without error 00% 8748 -
# 9 Short offline Completed without error 00% 8724 -
#10 Short offline Completed without error 00% 8700 -
#11 Short offline Completed without error 00% 8676 -
#12 Extended offline Completed without error 00% 8658 -
#13 Short offline Completed without error 00% 8652 -
#14 Short offline Completed without error 00% 8628 -
#15 Short offline Completed without error 00% 8604 -
#16 Short offline Completed without error 00% 8580 -
#17 Short offline Completed without error 00% 8556 -
#18 Short offline Completed without error 00% 8532 -
#19 Short offline Completed without error 00% 8508 -
#20 Extended offline Completed without error 00% 8490 -
#21 Short offline Completed without error 00% 8484 -
M
На сайте с 16.09.2009
Offline
278
#25
devd:
Непонятно как можно делать далеко идущие выводы незная полного вывода.

Непонятно какие выводы должны сделать читающие из вашего "неполного вывода".

devd:
Там все тесты за последний год успешны и не было переназначений.

Ну и? Сколько ремапов было за этот период? Какой процент времени занимает проверка (long) по отношению к общему рабочему времени?

devd:
Совсем глупо ничего не делать и верить только смарту.

Совсем глупо - считать инженеров сигейта идиотами и игнорировать штатные средства диагностики.

D
На сайте с 18.10.2011
Offline
109
#26

Инженеры сигейта рассчитывают на физические поломки и этим можно объяснить отсутствие ошибок.

Рост Reallocated_Sector_Ct начался уже после начала ежедневных тестирований, но ошибок не было.

M
На сайте с 16.09.2009
Offline
278
#27
devd:
Инженеры сигейта рассчитывают на физические поломки и этим можно объяснить отсутствие ошибок.

Объяснить отсутствие ошибок *во время тестирования* - можно просто включив голову. Наводящие вопросы вам задали выше.

devd:
Рост Reallocated_Sector_Ct начался уже после начала ежедневных тестирований, но ошибок не было.

И?

Как я понимаю, мониторить смарт-параметры вы не догадались и содержательных ответов я не дождусь. Ну смотрите.

Вы делаете вы long тестирование раз в неделю. Итого в самом лучшем случае: 541/7 ~ 80. Вот что имело бы шанс напороться на смарт-тесты.

Но тесты отрабатывают меньше чем за сутки, полагаю - *существенно* меньше. Кроме того мы не учли динамику появления бедов (она вряд-ли равномерная в любом временном масштабе), их начальное число. Наконец, диск *работает* в процессе тестирования - а значит ремап может произойти самым обычным образом и остаться незамеченным текущим тестом (ну, кроме изменения счетчика). Теперь вы можете сложить 2+2? :)

D
На сайте с 18.10.2011
Offline
109
#28
Как я понимаю, мониторить смарт-параметры вы не догадались

Я просто настроил smartmontools и жду от него адекватных уведомлений о проблемах, но на практике он оказывается бесполезен. Диск нормально работает

даже с большим Reallocated_Sector_Ct.

Дискам свойственно ломаться так быстро, что S.M.A.R.T. просто не успевает отобразить его изменившееся состояние.

M
На сайте с 16.09.2009
Offline
278
#29
devd:
Я просто настроил smartmontools и жду от него адекватных уведомлений о проблемах, но на практике он оказывается бесполезен.

1) настроить можно по-разному.

2) адекватные уведомления у вас есть. другое дело, что вы их игнорируете.

devd:
Диск нормально работает даже с большим Reallocated_Sector_Ct.

*Пока* работает. Но в любой момент может перестать. Этот показатель хорошо коррелирует с отказами. Не верите производителю - поверьте гуглу.

devd:
Дискам свойственно ломаться так быстро, что S.M.A.R.T. просто не успевает отобразить его изменившееся состояние.

Потому что, как правило, было полезно обращать внимание на показатели S.M.A.R.T. *до* "быстрой поломки".

leonid239
На сайте с 04.10.2011
Offline
132
#30

Посмотрите пожалуйста еще вот этот диск:


=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 114 100 006 Pre-fail Always - 59336424
3 Spin_Up_Time 0x0003 097 097 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 48
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 062 053 030 Pre-fail Always - 21484501022
9 Power_On_Hours 0x0032 096 096 000 Old_age Always - 4263
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 47
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 098 098 000 Old_age Always - 2
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 078 061 045 Old_age Always - 22 (Lifetime Min/Max 22/23)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 46
193 Load_Cycle_Count 0x0032 099 099 000 Old_age Always - 2212
194 Temperature_Celsius 0x0022 022 040 000 Old_age Always - 22 (0 12 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 267765441105992
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 2015046719153
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2139519776208
Поиск VPS (https://poiskvps.ru) - сайт для поиска виртуальных серверов
1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий