Сбой по квотам

12
К
На сайте с 14.03.2004
Offline
201
1360

1. На сервере два диска в рейде:

WDC WD5001ABYS-01YNA0

WDC WD5002ABYS-02B1B0

2. Рейд программный),

3. на них три ВПС

Недавно произошел сбой по квотам, в логах следующее:


Aug 6 01:37:53 localhost kernel: ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Aug 6 01:37:53 localhost kernel: ata2.00: BMDMA stat 0x64
Aug 6 01:37:53 localhost kernel: ata2.00: cmd 25/00:08:4f:00:70/00:00:36:00:00/e0 tag 0 dma 4096 in
Aug 6 01:37:53 localhost kernel: res 41/04:00:4f:00:70/04:00:36:00:00/e0 Emask 0x1 (device error)
Aug 6 01:37:53 localhost kernel: ata2.00: status: { DRDY ERR }
Aug 6 01:37:53 localhost kernel: ata2.00: error: { ABRT }
Aug 6 01:37:54 localhost kernel: ata2.00: configured for UDMA/133
Aug 6 01:37:54 localhost kernel: ata2.01: configured for UDMA/66
Aug 6 01:37:54 localhost kernel: ata2: EH complete

Aug 6 01:37:57 localhost kernel: ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Aug 6 01:37:57 localhost kernel: ata2.00: BMDMA stat 0x64
Aug 6 01:37:57 localhost kernel: ata2.00: cmd 25/00:08:4f:00:70/00:00:36:00:00/e0 tag 0 dma 4096 in
Aug 6 01:37:57 localhost kernel: res 41/04:00:4f:00:70/04:00:36:00:00/e0 Emask 0x1 (device error)
Aug 6 01:37:57 localhost kernel: ata2.00: status: { DRDY ERR }
Aug 6 01:37:57 localhost kernel: ata2.00: error: { ABRT }
Aug 6 01:37:58 localhost kernel: ata2.00: configured for UDMA/133
Aug 6 01:37:58 localhost kernel: ata2.01: configured for UDMA/66
Aug 6 01:37:58 localhost kernel: ata2: EH complete

Aug 6 01:38:01 localhost kernel: ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Aug 6 01:38:01 localhost kernel: ata2.00: BMDMA stat 0x64
Aug 6 01:38:01 localhost kernel: ata2.00: cmd 25/00:08:4f:00:70/00:00:36:00:00/e0 tag 0 dma 4096 in
Aug 6 01:38:01 localhost kernel: res 41/04:00:4f:00:70/04:00:36:00:00/e0 Emask 0x1 (device error)
Aug 6 01:38:01 localhost kernel: ata2.00: status: { DRDY ERR }
Aug 6 01:38:01 localhost kernel: ata2.00: error: { ABRT }
Aug 6 01:38:01 localhost kernel: ata2.00: configured for UDMA/133
Aug 6 01:38:02 localhost kernel: ata2.01: configured for UDMA/66
Aug 6 01:38:02 localhost kernel: ata2: EH complete

Aug 6 01:38:03 localhost kernel: sd 1:0:0:0: [sdc] 976773168 512-byte hardware sectors (500108 MB)
Aug 6 01:38:03 localhost kernel: sd 1:0:0:0: [sdc] Write Protect is off
Aug 6 01:38:03 localhost kernel: sd 1:0:0:0: [sdc] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA

Aug 6 01:38:03 localhost kernel: sd 1:0:0:0: [sdc] 976773168 512-byte hardware sectors (500108 MB)
Aug 6 01:38:03 localhost kernel: sd 1:0:0:0: [sdc] Write Protect is off
Aug 6 01:38:03 localhost kernel: sd 1:0:0:0: [sdc] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA

Я так понимаю не в порядке один из дисков.

Помогите плз советом.

Чем грозит и что желательно предпринять?

Интернет магазин православных икон Kiot.com.ua (http://kiot.com.ua) - для форумчан скидка (запрос в личку)
Electronn
На сайте с 01.02.2010
Offline
91
#1

нужен SMART диска, так как если есть Reallocated sectors или ошибки смарта в логе, то на замену отдавать.

К
На сайте с 14.03.2004
Offline
201
#2
Electronn:
нужен SMART диска, так как если есть Reallocated sectors или ошибки смарта в логе, то на замену отдавать.

в Webmin есть раздел "SMART Drive Status" - по нему можно что-то посмотреть? или нужно делать именно тест? но для теста, я понимаю, нужно снимать его

Electronn
На сайте с 01.02.2010
Offline
91
#3

c Webmin работал мало честно говоря. Лучше через ssh снять SMART :

smartctl --all /dev/s(h)da

шорттест - smartctl -t short /dev/s(h)da

Обращайтесь в ICQ - помогу.

rustelekom
На сайте с 20.04.2005
Offline
544
#4

Aug 6 01:37:57 localhost kernel: ata2.00: status: { DRDY ERR } в замену без раздумий. ну для острастки кабель еще подергать но, сомневаюсь я что то .

60% скидка на VPS в США, 20% скидка в Нидерландах и 40% в Финляндии. Новые тарифы на AMD Ryzen 9950x с частотой до 5.7 ГГц со скидкой 40% RoboVPS https://www.robovps.biz
M
На сайте с 01.12.2009
Offline
235
#5
Константин:
1. На сервере два диска в рейде:
WDC WD5001ABYS-01YNA0
WDC WD5002ABYS-02B1B0
2. Рейд программный),
3. на них три ВПС

Недавно произошел сбой по квотам, в логах следующее:


Я так понимаю не в порядке один из дисков.

Помогите плз советом.
Чем грозит и что желательно предпринять?

Что-бы разобраться нужен мониторинг,лучше конечно доверить тем кто знает что делать :)

Администратор Linux,Freebsd. построения крупных проектов.
К
На сайте с 14.03.2004
Offline
201
#6
Electronn:
c Webmin работал мало честно говоря. Лучше через ssh снять SMART :

smartctl --all /dev/s(h)da

шорттест - smartctl -t short /dev/s(h)da

Обращайтесь в ICQ - помогу.

что нам это даст?

Raistlin
На сайте с 01.02.2010
Offline
247
#7

Константин, rustelecom правильно сказал. Диск мертв будет в ближайшее время. Я вам это говорю как человек, который занимался восстановлением данных одно время.

HostAce - Асы в своем деле (http://hostace.ru)
Pavel.Odintsov
На сайте с 13.05.2009
Offline
169
#8
Electronn:
нужен SMART диска, так как если есть Reallocated sectors или ошибки смарта в логе, то на замену отдавать.

Не обязательно, такая сказка в dmesg уже показание на замену винта.

Решение по обнаружению DDoS атак для хостинг компаний, дата центров и операторов связи: FastNetMon (https://fastnetmon.com)
Zaqwr
На сайте с 08.08.2007
Offline
111
#9
Константин:
2. Рейд программный),

и кто возьмётся прочитать smart ? не все контролеры его дадут прочесть...

Администрирование, Linux, Cisco, Juniper
D
На сайте с 11.05.2010
Offline
15
#10
Zaqwr:
и кто возьмётся прочитать smart ? не все контролеры его дадут прочесть...

первый раз такое слышу, назовите хоть пару SATA контролеров, которые НЕ дают это сделать

С напильником и бубном (http://kaba.org.ua)
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий