Все ли нормально с дисками?

D
На сайте с 28.06.2008
Offline
1114
461

Сегодня заметил что скачкообразно тупит сервер. Лишнего трафика не выявил, решил провреить диски.

Можете посмотреть результаты тестов, есть ли проблемы?

root@ ~ # smartctl -A /dev/sda
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 081 063 044 Pre-fail Always - 140184261
3 Spin_Up_Time 0x0003 093 093 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 7
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 088 060 030 Pre-fail Always - 740320534
9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 9492
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 7
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 066 060 045 Old_age Always - 34 (Min/Max 25/40)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 4
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 7
194 Temperature_Celsius 0x0022 034 040 000 Old_age Always - 34 (0 23 0 0)
195 Hardware_ECC_Recovered 0x001a 025 009 000 Old_age Always - 140184261
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0

sdb

root@ ~ # smartctl -a /dev/sdb

=== START OF INFORMATION SECTION ===
Device Model: ST33000650NS
Serial Number: Z29858SA
LU WWN Device Id: 5 000c50 06419c7dc
Firmware Version: 0004
User Capacity: 3,000,592,982,016 bytes [3.00 TB]
Sector Size: 512 bytes logical/physical
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Mon Oct 20 11:06:43 2014 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 600) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 255) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x10bd) SCT Status supported.
SCT Error Recovery Control supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 084 063 044 Pre-fail Always - 236697301
3 Spin_Up_Time 0x0003 093 093 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 7
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 088 060 030 Pre-fail Always - 742038181
9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 9492
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 7
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 066 060 045 Old_age Always - 34 (Min/Max 26/40)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 4
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 7
194 Temperature_Celsius 0x0022 034 040 000 Old_age Always - 34 (0 23 0 0)
195 Hardware_ECC_Recovered 0x001a 024 009 000 Old_age Always - 236697301
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 9492 -
# 2 Short offline Completed without error 00% 8389 -
# 3 Short offline Completed without error 00% 13 -
# 4 Short offline Completed without error 00% 12 -
# 5 Extended offline Completed without error 00% 6 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

yesRuslik
На сайте с 08.02.2009
Offline
178
#1
Dram:
Сегодня заметил что скачкообразно тупит сервер. Лишнего трафика не выявил, решил провреить диски.

Можете посмотреть результаты тестов, есть ли проблемы?



sdb

С дисками судя по смарту проблем нет. Возможно массив синхронизируется или где-то директория с большим количеством файлов появилась. "Покажите специалисту".

Аренда выделенных серверов (http://yeshost.ru/) от 69 евро VDS сервер (http://yeshost.ru/vds) от 7.95евро Виртуальный хостинг (http://yeshost.ru/virtualhosting)от 0.95 евро Windows VDS хостинг скоро (http://yeshost.ru/vds)
Romka_Kharkov
На сайте с 08.04.2009
Offline
485
#2

Dram, я всегда и всем рекомендую использовать графическое представление происходящего в системе, воспользуйтесь такими тулзами например как munin, он прекрасно отражает множественные вещи в вашей системе при том в виде графиков за сегодня, вчера, неделю, месяц, есть с чем сравнить, есть что посмотреть, мониторит как систему так и сервисы...

Вот вы увидели какую-то "скачкообразную" нагрузку.... кстати как вы её увидели? А она может быть вызвана например тем что 1 клиент на сервере обновил свой скрипт и у него надо на 20.000 запросов в MySQL больше :)))) (Условно)... на графике вы бы четко увидели всплеск активности в MYSQL... по отношению к данным например недельной давности и поняли бы в каком направлении копать... А так ваша нагрузка может быть чем угодно.... начиная от утечки памяти на сервере заканчивая неадекватными действиями соседей по серверу (если таковые имеются)..... и.т.п....

А с дисками (судя по смарту) вопросов нет...

Есть около 15.000 ipv4 !!! (http://onyx.net.ua/price.php#ipv4) Качественный хостинг с 2005 года - лучшее клиентам! (http://onyx.net.ua/)
D
На сайте с 28.06.2008
Offline
1114
#3

Romka_Kharkov, спасибо!

Glueon
На сайте с 26.07.2013
Offline
172
#4

Если диски находятся в RAID массиве вполне вероятно, что запустилась плавновая проверка массива, поэтому и тупит.

Посмотрите значение WA в утилите top. И iostat -xN

Есть много IP-сетей в аренду под прокси, парсинг, рассылки (optin), vpn и хостинг. Телега: @contactroot ⚒ ContactRoot команда опытных сисадминов (/ru/forum/861038), свой LIR: сдаем в аренду сети IPv4/v6 (/ru/forum/1012475).

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий