Замена вышедшего из строя диска в RAID LSI.

zexis
На сайте с 09.08.2005
Offline
388
20739

На сервере стоит контроллер LSI 9260-4i

Сервер Supermicro с корзинами горячей замены.

Используется RAID10.

Администрирую через SSH через утилиту командной строки CLI.

Один из дисков начал выдавать ошибку.

./MegaCli64 -pdInfo -PhysDrv[252:1] -a0

Firmware state: Failed

RAID массив перешел в статус Degraded.

Раньше никогда не менял диски на этом контроллере. Прошу подсказать последовательность действий по замене.

Нужно ли переводить сломавшийся диск перед заменой в статус offline или в статус missing ?

Нашел в документации такие команды.

./MegaCli64 - PDOffline -PhysDrv[252:1] -a0

./MegaCli64 -PDPrpRmv -PhysDrv[252:1] -a0

./MegaCli64 -PDMarkMissing -PhysDrv[252:1] -a0

Но какие из них нужно выполнить для сломавшегося диска не понял.

Или же можно просто вытащить на работающем сервере сломавшийся диск и вставить новый?

Romka_Kharkov
На сайте с 08.04.2009
Offline
485
#1
zexis:

Или же можно просто вытащить на работающем сервере сломавшийся диск и вставить новый?

Именно так и делаю всегда, при условии что рейд толковый он даже ребилд начнет сам, а если не очень толковый или замысловато настроены логические разделы то надо будет винт потом пометить как Hot Spare или сделать его Online....

Есть около 15.000 ipv4 !!! (http://onyx.net.ua/price.php#ipv4) Качественный хостинг с 2005 года - лучшее клиентам! (http://onyx.net.ua/)
Y1
На сайте с 06.02.2011
Offline
59
#2

Контроллер толковый (это к посту Romka_Kharkov), винт ребилдится сам, замена только "на горячую".

Из нюансов по аналогичному контроллеру - один знакомый отметил проблемы с заменой, если диски подключены не напрямую, а через экспандер.

zexis
На сайте с 09.08.2005
Offline
388
#3

Не исправный диск Seagate ST32000444SS вытащил на работающем сервере.

Предварительно никаких команд не делал.

Сервер продолжает работать на 3-х дисках.

Отвез диск в магазин где покупал. Там подтвердили, что диск умер.

Через 2 недели пообещали предоставить новый по гарантии.

Что то долго 2 недели ждать замены.

Ведь если еще один диск в этот период умрет, то данные будут потеряны.

B
На сайте с 23.10.2006
Offline
170
#4
zexis:

Ведь если еще один диск в этот период умрет, то данные будут потеряны.

Ну это 50/50 RAID10 это же 2 рэйда0 - так-что он и на 2х дисках работать будет, при наличие везения конешно )

Rimlyanin
На сайте с 22.02.2006
Offline
200
#5
bimcom:
Ну это 50/50 RAID10 это же 2 рэйда0 - так-что он и на 2х дисках работать будет, при наличие везения конешно )

если винты с одно партии, то везение может оказаться гораздо меньше чем 50/50

Romka_Kharkov
На сайте с 08.04.2009
Offline
485
#6

zexis, обычно винты на замену в массив должны быть в резерве ... Ну это так к слову :) Массив ваш будет работать и на 2х дисках, но десятка это сбор двух мирроров в страйп, а это означает что если у вас 1 из участников страйпа умер ... (т.е 2 винта в 1м мирроре) значит всему будет каюк.... По этому 2 недели ждать ... это как по мне бред..... если сервер продуктивный и под нагрузкой, можно не дождаться... У меня был случай когда в Raid-5 упало 2 винта в разницой в несколько часов.... (типа с утра 1 выняли, замену не поставили, к вечеру нет второго винта и нет массива с данными :( )

Рекомендую не затягивать с заменой и на будущее иметь всегда винт в запасе, а лучше его сразу в масив на горячую замену включать....

---------- Добавлено 05.07.2012 в 08:04 ----------

Rimlyanin:
если винты с одно партии, то везение может оказаться гораздо меньше чем 50/50

Поддерживаю!

---------- Добавлено 05.07.2012 в 08:04 ----------

bimcom:
Ну это 50/50 RAID10 это же 2 рэйда0 - так-что он и на 2х дисках работать будет, при наличие везения конешно )

Это только в том случае если выгорает второй винт из соседнего raid0 :))) А если в том же ... то пепец :D

Rimlyanin
На сайте с 22.02.2006
Offline
200
#7
Romka_Kharkov:

Поддерживаю!

А ещё на моей практике было что один винт сдох, контроллер подхватывает резервный винт, начинает ребилдить... и от возросшей нагрузке вылетает ещё один винт.

Бакапы рулят....

zexis
На сайте с 09.08.2005
Offline
388
#8
Rimlyanin:
А ещё на моей практике было что один винт сдох, контроллер подхватывает резервный винт, начинает ребилдить... и от возросшей нагрузке вылетает ещё один винт.
Бакапы рулят....

Да это понятно, что лучшая гарантия от сбоев это регулярные бэкапы на другой сервер.

Но на сервере 400 Гб регулярно обновляемой информации и для бэкапов нужно брать второй сервер.

Y1
На сайте с 06.02.2011
Offline
59
#9
Romka_Kharkov:
... У меня был случай когда в Raid-5 упало 2 винта в разницой в несколько часов.... (типа с утра 1 выняли, замену не поставили, к вечеру нет второго винта и нет массива с данными :( ) ...

Ситуация весьма характерна для 5 рэйда, но с одной ремаркой - второй винт вылетает во время ребилда, как и писал Rimlyanin. А вот с 10 такого почему-то не случалось, может просто везло. Неделю назад восстанавливали 10 рэйд, из 4 дисков "в живых" оставалось только 2 (на наше счастье - пара в страйпе). Всё закончилось вполне благополучно :))))

Romka_Kharkov:
... Рекомендую не затягивать с заменой и на будущее иметь всегда винт в запасе, а лучше его сразу в масив на горячую замену включать....

Без экспандера этот контроллер всего 4 винта держит, винт HotSpare уже некуда повесить ;)

zexis
На сайте с 09.08.2005
Offline
388
#10
yeugeny1:

Без экспандера этот контроллер всего 4 винта держит, винт HotSpare уже некуда повесить ;)

Да и в сервере 1U всего 4 корзины. Так что HotSpare ставить не куда.

По хорошему конечно надо

1) всегда иметь уже купленный запасной диск такой же модели, что бы сразу его заменить, а не ждать несколько дней замены в магазине.

2) Настроить регулярные автоматические бекапы на другой сервер или VPS.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий