pre-fail в smart винтов

12
Dreammaker
На сайте с 20.04.2006
Offline
569
9985

Вопрос касается домашнего компа, но всё же по смыслу ближе к этому разделу поэтому решил запостить сюда.

В выдаче GSmartControl для 2 винтов у ряда параметров появляется pre-fail:

винт /dev/sda (номер 1)


smartctl 5.40 2010-03-16 r3077 [x86_64-unknown-linux-gnu] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar Blue Serial ATA family
Device Model: WDC WD2500AAKS-00C9A0
Serial Number: WD-WCARW4513972
Firmware Version: 12.01B02
User Capacity: 250,059,350,016 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: Exact ATA specification draft version not indicated
Local Time is: Sun Oct 17 03:56:04 2010 EEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x84) Offline data collection activity
was suspended by an interrupting command from host.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (6480) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 78) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SCT capabilities: (0x303f) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 199 196 051 Pre-fail Always - 4984
3 Spin_Up_Time 0x0003 160 156 021 Pre-fail Always - 4983
4 Start_Stop_Count 0x0032 099 099 000 Old_age Always - 1151
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x000e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 087 087 000 Old_age Always - 9887
10 Spin_Retry_Count 0x0012 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0012 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 1150
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 112
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 1152
194 Temperature_Celsius 0x0022 103 095 000 Old_age Always - 44
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0

SMART Error Log Version: 1
ATA Error Count: 4981 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 90% 1819 159807914
# 2 Extended offline Completed: read failure 90% 1819 159807914

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

винт /dev/sdb (номер 2, тут даю только табличку с параметрами, а то форум ругается что много букв)


SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 158 155 021 Pre-fail Always - 5091
4 Start_Stop_Count 0x0032 099 099 000 Old_age Always - 1146
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 051 Old_age Always - 0
9 Power_On_Hours 0x0032 087 087 000 Old_age Always - 9862
10 Spin_Retry_Count 0x0032 100 100 051 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 051 Old_age Always - 0
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 1144
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 109
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 1146
194 Temperature_Celsius 0x0022 104 097 000 Old_age Always - 43
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 051 Old_age Offline - 0


Как я понимаю - это не очень хорошо. Пожалуйста, объясните чего мне стоит ожидать и стоит ли к чему-то готовится или уже прямо сейчас стоит покупать новый винт/винты? :)

GL
На сайте с 30.08.2010
Offline
25
#1

спокойно :) с винтами все хорошо. pre-fail в выводе означает тип параметра, а не то что он вышел за границы нормы.

администрирование *nix,windows () icq 99033430
Dreammaker
На сайте с 20.04.2006
Offline
569
#2

guns_linger, спасибо, а то я уже перепугался, что торрентами подпортил винты :)

iamsens
На сайте с 26.08.2009
Offline
115
#3

да, с вениками всё ок

Pavel.Odintsov
На сайте с 13.05.2009
Offline
169
#4

Господа, Вы чего?

Dreammaker, /dev/sda почти однозначно под замену, там сбои self-тестов (# 1 Extended offline Completed: read failure), это дополнение к смарт-метрикам и часто они намного более показательны. Также, судя по выдаче, в smart логе есть ошибки, но они почему-то не были показаны, попробуйте вот так сделать в консоли:

smartctl --all /dev/sda

Важны не только метрики, но и блоки внизу, так что для /dev/sdb предоставьте пожалуйста полную выдачу.

Решение по обнаружению DDoS атак для хостинг компаний, дата центров и операторов связи: FastNetMon (https://fastnetmon.com)
iamsens
На сайте с 26.08.2009
Offline
115
#5

извиняюсь, не заметил строк

SMART Self-test log structure revision number 1

Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error

# 1 Extended offline Completed: read failure 90% 1819 159807914
# 2 Extended offline Completed: read failure 90% 1819 159807914

надо тест веника провести, -t long

если тест пройдет, то всё ок, если нет, то надо смотреть

пока причин для замены нет

OS
На сайте с 11.02.2009
Offline
46
#6
iamsens:
извиняюсь, не заметил строк
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 90% 1819 159807914
# 2 Extended offline Completed: read failure 90% 1819 159807914


надо тест веника провести, -t long
если тест пройдет, то всё ок, если нет, то надо смотреть

пока причин для замены нет

Это и есть результат работы long теста, говорящий о невозможности чтения очередного блока данных с диска. Является поводом для гарантийной замены диска, либо походом до ближайшей свалки )

iamsens
На сайте с 26.08.2009
Offline
115
#7
Oleg_ST:
Это и есть результат работы long теста, говорящий о невозможности чтения очередного блока данных с диска. Является поводом для гарантийной замены диска, либо походом до ближайшей свалки )

далеко не факт

Pavel.Odintsov
На сайте с 13.05.2009
Offline
169
#8

Это вполне объективный факт - винт на свалку :) Любые ошибки в логе SMART / ошибки self-тестов почти гарантия, что винт если и не откажет, то повесит систему / побьет файловую очень скоро.

iamsens
На сайте с 26.08.2009
Offline
115
#9
Pavel.Odintsov:
Это вполне объективный факт - винт на свалку :) Любые ошибки в логе SMART / ошибки self-тестов почти гарантия, что винт если и не откажет, то повесит систему / побьет файловую очень скоро.

а мне кажется по-другому, если пройтись по-диску badblcocksом, то винт нормально пройдет смарт-тест, а выкинуть веник дело последнее, это ж десктоп всё таки, а не сервер на гарантии...

Pavel.Odintsov
На сайте с 13.05.2009
Offline
169
#10
iamsens:
а мне кажется по-другому, если пройтись по-диску badblcocksом, то винт нормально пройдет смарт-тест, а выкинуть веник дело последнее, это ж десктоп всё таки, а не сервер на гарантии...

Ну так-то да, но вообще отказ рабочей машины часто фатальнее отказа сервера :)

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий