Состояние HDD (SMART)

C
На сайте с 14.07.2008
Offline
147
995

Помогите, пожалуйста, оценить состояние жестких дисков. Сервер у Hetzner.

Можно ли еще не менять 1 год?

~# smartctl -A /dev/sda
smartctl 5.40 2010-07-12 r3124 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 106 092 006 Pre-fail Always - 11405147
3 Spin_Up_Time 0x0003 098 098 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 8
5 Reallocated_Sector_Ct 0x0033 042 042 036 Pre-fail Always - 2408
7 Seek_Error_Rate 0x000f 082 060 030 Pre-fail Always - 191313568
9 Power_On_Hours 0x0032 066 066 000 Old_age Always - 30539
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 12
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 094 094 000 Old_age Always - 6
188 Command_Timeout 0x0032 100 099 000 Old_age Always - 4295098373
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 063 057 045 Old_age Always - 37 (Lifetime Min/Max 34/42)
194 Temperature_Celsius 0x0022 037 043 000 Old_age Always - 37 (0 19 0 0)
195 Hardware_ECC_Recovered 0x001a 042 022 000 Old_age Always - 11405147
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 93913754924929
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 483410869
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 3454926682

smartctl -A /dev/sdb
smartctl 5.40 2010-07-12 r3124 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 106 097 006 Pre-fail Always - 12113224
3 Spin_Up_Time 0x0003 096 096 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 22
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 076 060 030 Pre-fail Always - 48969062
9 Power_On_Hours 0x0032 070 070 000 Old_age Always - 26856
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 11
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 098 000 Old_age Always - 18
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 065 059 045 Old_age Always - 35 (Lifetime Min/Max 31/40)
194 Temperature_Celsius 0x0022 035 041 000 Old_age Always - 35 (0 22 0 0)
195 Hardware_ECC_Recovered 0x001a 043 020 000 Old_age Always - 12113224
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 1
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 1
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 40316858034439
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 1184184743
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 1846551172



/dev/sda:
Timing cached reads: 17574 MB in 2.00 seconds = 8796.96 MB/sec
Timing buffered disk reads: 282 MB in 3.01 seconds = 93.84 MB/sec

/dev/sdb:
Timing cached reads: 16162 MB in 2.00 seconds = 8089.99 MB/sec
Timing buffered disk reads: 126 MB in 3.06 seconds = 41.14 MB/sec
M
На сайте с 30.08.2010
Offline
92
#1

как минимум, sda я бы поменял

Malcolm
На сайте с 02.05.2007
Offline
119
#2

Первый диск на свалку пора. Куча переназначенных секторов и по возрасту более трех лет работы получается, если это значение в часах указано.

Glueon
На сайте с 26.07.2013
Offline
172
#3

Как только пошли перераспределенные секторы - надо менять. Тем более в hetzner, по-моему, такие диски мменяют меняют без проблем

Есть много IP-сетей в аренду под прокси, парсинг, рассылки (optin), vpn и хостинг. Телега: @contactroot ⚒ ContactRoot команда опытных сисадминов (/ru/forum/861038), свой LIR: сдаем в аренду сети IPv4/v6 (/ru/forum/1012475).
iamsens
На сайте с 26.08.2009
Offline
115
#4

если к-во релокейтов не растет, может терпеть

 5 Reallocated_Sector_Ct 0x0033 042 042 036 Pre-fail Always - 2408

бывает из-за одного пендинга, сервер виснет

 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 1

я б менял оба диска

Andreyka
На сайте с 19.02.2005
Offline
822
#5

Hetnzer меняет диски после неудачного теста

Запускайте и проверяйте

Не стоит плодить сущности без необходимости
pupseg
На сайте с 14.05.2010
Offline
347
#6

reallocated > 0 , даже если 1 и держится долго - все-равно менять.

это - если в очень тупом приближении - аналог бэдов. со временем будут только расти.

Качественная помощь в обслуживании серверов. (/ru/forum/661100) Бесплатных консультаций не даю, не помогаю, не обучаю. Минималка от 100$. Как пропатчить KDE-просьба не спрашивать. Есть форумы (http://linux.org.ru) и полезные сайты (http://www.opennet.ru/).
Glueon
На сайте с 26.07.2013
Offline
172
#7

Почему в тупом приближении? Вместо битых блоков выдаются блоки из резервной области, поэтому это число можно трактовать либо как количество занятых блоков в резервной области, либо как количество нерабочих, читай бэдов.

cjseriy,

В dmesg нет сообщений о i/o проблемах?

Mik Foxi
На сайте с 02.03.2011
Offline
1076
#8

если количество стоит на месте, то пофигу, можно жить. у меня так многие диски уже по 4 года работают. а некоторые молодые и по тестам идеальные - оп и сдох внезапно.

Антибот, антиспам, веб файрвол, защита от накрутки поведенческих: https://antibot.cloud/ + партнерка, до 40$ с продажи.
Glueon
На сайте с 26.07.2013
Offline
172
#9
foxi:
если количество стоит на месте, то пофигу, можно жить. у меня так многие диски уже по 4 года работают. а некоторые молодые и по тестам идеальные - оп и сдох внезапно.

А причины описдоха - исключительно брак и подготовиться к этому никак? Исходя из опыта. Просто ни разу с такой ситуацией не сталкивался за исключением горения ДЦ и скачков напряжения.

seocore
На сайте с 25.09.2006
Offline
143
#10
Glueon:
Вместо битых блоков выдаются блоки из резервной области, поэтому это число можно трактовать либо как количество занятых блоков в резервной области, либо как количество нерабочих, читай бэдов.

само появление таких блоков - это уже признаки скорого ухода, диск конечно работать еще будет какое-то время, но крайне нестабильно

Glueon:
А причины описдоха - исключительно брак и подготовиться к этому никак?

может полететь электроника, может тупо пайка плохая и контакт отходит, может сдохнуть механика (характерно для "зеленой" серии дисков) и т.п. различные сценарии, для предотвращения этого и используют RAID-1 в большинстве случаев 🍿

Инструменты для веб-мастера: кластеризатор СЯ (https://goo.gl/MQWfqO), все запросы конкурента (https://goo.gl/hd5uHS), дешевые XML-лимиты (https://goo.gl/aDZbPI)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий