проверка HDD badblocks vs smartctl - кому верить? - Администрирование серверов - Сайтостроение

120

vlad0708

9 марта 2013, 19:41

5611

Проверил диски с помощью smartctl и badblocks.

На dev/sdb smartctl говорит что все ОК, а badblocks находит аж 5 блоков.

Кому верить? Распечатка ниже.

Наличие bad blocks дает мне право попросить хостера заменить диски?

Или есть какой-то допустимый процент?

badblocks -v /dev/sda

Checking blocks 0 to 976762583

Checking for bad blocks (read-only test): 10480064done, 1:23 elapsed

done

Pass completed, 1 bad blocks found.

badblocks -v /dev/sdb

Checking blocks 0 to 976762583

Checking for bad blocks (read-only test): 493008320one, 51:51 elapsed

493008380one, 52:23 elapsed

493008381one, 52:39 elapsed

493008382one, 52:56 elapsed

493008383one, 53:12 elapsed

done

Pass completed, 5 bad blocks found.

smartctl -A /dev/sda

smartctl 5.42 2011-10-20 r3458 [x86_64-linux-3.2.13-grsec-xxxx-grs-ipv6-64] (local build)

=== START OF READ SMART DATA SECTION ===

SMART Attributes Data Structure revision number: 16

Vendor Specific SMART Attributes with Thresholds:

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE

1 Raw_Read_Error_Rate 0x000b 100 100 016 Pre-fail Always - 0

2 Throughput_Performance 0x0005 140 140 054 Pre-fail Offline - 76

3 Spin_Up_Time 0x0007 125 125 024 Pre-fail Always - 183 (Average 184)

4 Start_Stop_Count 0x0012 100 100 000 Old_age Always - 18

5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 16

7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0

8 Seek_Time_Performance 0x0005 110 110 020 Pre-fail Offline - 36

9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 2111

10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0

12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 18

192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 362

193 Load_Cycle_Count 0x0012 100 100 000 Old_age Always - 362

194 Temperature_Celsius 0x0002 200 200 000 Old_age Always - 30 (Min/Max 12/36)

196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 18

197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 0

198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0

199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 0

smartctl -A /dev/sdb

smartctl 5.42 2011-10-20 r3458 [x86_64-linux-3.2.13-grsec-xxxx-grs-ipv6-64] (local build)

=== START OF READ SMART DATA SECTION ===

SMART Attributes Data Structure revision number: 16

Vendor Specific SMART Attributes with Thresholds:

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE

1 Raw_Read_Error_Rate 0x000b 084 084 016 Pre-fail Always - 9830578

2 Throughput_Performance 0x0005 137 137 054 Pre-fail Offline - 87

3 Spin_Up_Time 0x0007 124 124 024 Pre-fail Always - 185 (Average 185)

4 Start_Stop_Count 0x0012 100 100 000 Old_age Always - 18

5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0

7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0

8 Seek_Time_Performance 0x0005 113 113 020 Pre-fail Offline - 35

9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 1794

10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0

12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 18

192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 72

193 Load_Cycle_Count 0x0012 100 100 000 Old_age Always - 72

194 Temperature_Celsius 0x0002 206 206 000 Old_age Always - 29 (Min/Max 11/35)

196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0

197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 8

198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0

199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 0

523

Den73

9 марта 2013, 19:52

#1

все нормально у вас с дисками, думаю хостер откажет в замене ибо нет в этом необходимости и причин, у вас есть конкретные проблемы?

120

vlad0708

9 марта 2013, 19:57

#2

пока проблем нет.

Просто перед тем как выпустить сервер в production, пытаюсь понять в каком состоянии HDD.

Команда badblocks может врать?

523

Den73

9 марта 2013, 20:04

#3

утилита проверяет возможность чтения сектора, скорее всего на /dev/sdb скоро появиться Reallocated_Sector но не обязательно.

не чего страшного, диски не такие старые, в зеркало их и все будет работать.

у меня есть сервера с не большим количеством Reallocated_Sector, вот когда резко растет это число или диск греется или резко высокий iowait и отклик то это уже повод для замены.

вообщем рисовалки графиков в этом помогают определить проблему.

Внешняя перелинковка сайтов для Active connections > 6K Давайте протестируем скриптом призводительность

200

Rimlyanin

9 марта 2013, 23:35

#4

а еще стоит понять, что есть soft-беды и hard.

Например: когда то в одной трехбуквенной компании выпускали винчестеры (сейчас уже давно перепродали это бизнес), и вот обнаружилась в этих винчестерах проблема, а именно, плохой контакт между платой электроники и собственно, гермоблоком. в результате была возможна такая ситуация, что при записи данных на жесткий диск они могли записываться не верно. а значит контрольная сумма сектора не сходилась. естественно, все утилиты, хоть chkdsk, хоть fsck, считали такой сектор плохим, и соответственно помечали его. А вот если устроить полное стирание этому винчестеру, то вдруг все сектора начинали работать правильно. некоторое время. Если не полечить контакты...

http://hardw.net/forum/topic323.htm

1

Кря(а)козябл(р)ы - какое происхождение Замена вышедшего из строя Побились базы MySQL

143

seocore

11 марта 2013, 13:10

#5

vlad0708:

smartctl -A /dev/sda
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 16
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 18

smartctl -A /dev/sdb
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 8

исходя из этих данных:

1) sda в порядке, но проблемы начнутся в ближайшее время (уже есть 16 переназначенных секторов, т.е. секторы читались/писались нестабильно и система их "утилизировала", при этом данные на них не потерялись, а просто перемещены были в другие сектора)

2) sdb уже имеет в наличии 8 плохих секторов (с потерянной информацией на них)

оба диска уже можно выбрасывать, хотя sda еще можно использовать под те же бэкапы, но продакшн систему на нем держать уже нет смысла

1

Инструменты для веб-мастера: кластеризатор СЯ (https://goo.gl/MQWfqO), все запросы конкурента (https://goo.gl/hd5uHS), дешевые XML-лимиты (https://goo.gl/aDZbPI)

Интересная проблема при реконструкции Нужен сервер, hetzner, на Пересборка SW RAID-1

DV

644

DenisVS

11 марта 2013, 15:40

#6

Rimlyanin, 20 Гб дятлы от IBM?

1

VDS хостинг ( http://clck.ru/0u97l ) Нет нерешаемых задач ( https://searchengines.guru/ru/forum/806725 ) | Перенос сайтов на Drupal 7 с любых CMS. ( https://searchengines.guru/ru/forum/531842/page6#comment_10504844 )

485

Romka_Kharkov

11 марта 2013, 16:11

#7

vlad0708, а почему вы не продолжаете начатую вот тут тему?

Судя по вопросу, это именно оттуда, а судя по ответам людей, так вообще оно :D

Есть около 15.000 ipv4 !!! (http://onyx.net.ua/price.php#ipv4) Качественный хостинг с 2005 года - лучшее клиентам! (http://onyx.net.ua/)

120

vlad0708

13 марта 2013, 18:25

#8

Romka_Kharkov:
vlad0708, а почему вы не продолжаете начатую вот тут тему?

в этой теме более конкретный вопрос.

seocore:
исходя из этих данных:
1) sda в порядке, но проблемы начнутся в ближайшее время (уже есть 16 переназначенных секторов, т.е. секторы читались/писались нестабильно и система их "утилизировала", при этом данные на них не потерялись, а просто перемещены были в другие сектора)
2) sdb уже имеет в наличии 8 плохих секторов (с потерянной информацией на них)

оба диска уже можно выбрасывать, хотя sda еще можно использовать под те же бэкапы, но продакшн систему на нем держать уже нет смысла

я прочитал очень много отзывов в Интернете, и то что на sda 16 rellocated это в целом ерунда, как я понял. У некоторых сервера при покупке уже имеют rellocated главное чтобы это число не увеличивалось.

Кто-нибудь еще из этой ветки считает, что sda пора выбрасывать?

А с sdb мне вообще не понятна ситуация. Там rellocated 0. Команда badblocks может врать?

Интересная проблема при реконструкции Нужен сервер, hetzner, на Интересная ситуация с нагрузкой

222

iren K

13 марта 2013, 18:30

#9

DenisVS:
Rimlyanin, 20 Гб дятлы от IBM?

они,со стеклянными пластинами

c уважением Iren

485

Romka_Kharkov

13 марта 2013, 19:22

#10

vlad0708:
в этой теме более конкретный вопрос.

я прочитал очень много отзывов в Интернете, и то что на sda 16 rellocated это в целом ерунда, как я понял. У некоторых сервера при покупке уже имеют rellocated главное чтобы это число не увеличивалось.

Кто-нибудь еще из этой ветки считает, что sda пора выбрасывать?
А с sdb мне вообще не понятна ситуация. Там rellocated 0. Команда badblocks может врать?

Я писал вам в той теме, что при стольких часах наработки, появились уже 16 Reallocated... у вас там интенсивность работы с винтами вообще какая? может у вас 2 сайта там крутится? Дайте плотную запись , гиг на 20-30-40 .... посмотрите потом на показатели и вообще не процесс....

Я лично считаю что Reallocated , а уж тем более Pending Sectors должно быть 0 и никак иначе, в противном случае это первые сигналы того, что винт начинает умирать....

Любая программа может врать, включая показатели самого Smart..... именно в этом и вопрос, хочется ли вам верить в то, что винт жив при наличии 16 Reallocated ;) А так , панацеи нет, на 100% ни один софт ничего вам не скажет .....

Вот тут вот http://ru.wikipedia.org/wiki/S.M.A.R.T. , есть прекрасная таблица "ответов SMART", там черным по белому написано что:

Reallocated Sectors Count:

Число операций переназначения секторов. Когда диск обнаруживает ошибку чтения/записи, он помечает сектор «переназначенным» и переносит данные в специально отведённую резервную область. Вот почему на современных жёстких дисках нельзя увидеть bad-блоки — все они спрятаны в переназначенных секторах. Этот процесс называют remapping, а переназначенный сектор — remap. Чем больше значение, тем хуже состояние поверхности дисков. Поле raw value содержит общее количество переназначенных секторов.
Рост значения этого атрибута может свидетельствовать об ухудшении состояния поверхности блинов диска.

По этому даже теоретически, если у вас +10 таких секторов в день ... можно жить.... потому что они будут ремапится до тех пор пока будет возможность.... но в любой момент вы можете наступить на область в которой получите 100 Pending Sectors, А это уже означает вот что:

Число секторов, являющихся кандидатами на замену. Они не были ещё определены как плохие, но считывание с них отличается от чтения стабильного сектора, это так называемые подозрительные или нестабильные сектора. В случае успешного последующего прочтения сектора он исключается из числа кандидатов. В случае повторных ошибочных чтений накопитель пытается восстановить его и выполняет операцию переназначения (remaping).
Рост значения этого атрибута может свидетельствовать о физической деградации жёсткого диска.

Резюмируйте, а потом взвесьте что дороже: "разобраться с тем что же все таки вам отвечает Smart" и "потеря всех данных".

Лично я еще посматриваю за "Spin-Up Retry Count"

Изношенность диска Интересная проблема при реконструкции SATA2 WD VelociRaptor

Зачем быть уникальным в мире, где все можно скопировать

В 2023 году Google заблокировал более 170 млн фальшивых отзывов на Картах

проверка HDD badblocks vs smartctl - кому верить?