Неприятный случай с RAID 1

AD
На сайте с 30.12.2011
Offline
73
3887

У меня на арендуемом выделенном сервере диски (кол-во дисков 2) собраны по схеме RAID 1 (зеркалирование).

Неделю назад у моего сервера случился откат на очень раннюю дату 1 июня. На вопрос как такое могло произойти, откуда вообще взялись данные за 1 июня - сотрудник поддержки выдвинул версию:

"у меня только одно предположение: если проблемы с определением одного из дисков в массиве возникли 1-го числа (не обнаружение, а именно возникновение), а затем диск был снова возвращен в RAID, могло произойти так, что синхронизация пошла именно с него, а не со второго диска. При определенной последовательности действий это впролне могло произойти и это единственное, чем можно объяснить полный откат системы на указанное число."

Слава богу была резервная копия которая была создана перед этим случаем ночью. С нее были восстановлены данные.

Но я думаю что если бы откат случился перед самым началом резервного копирования, то я мог просто не успеть среагировать даже если бы не спал, и копия могла затереться на неактуальную с неактуальных данных. Да и потеря данных за сутки - тоже неприятно.

Мне надо попытаться исключить вероятность такой ситуации в будущем. Прочитал на одном форуме "RAID 1 - это лишь средство сокращения простоя", но получается что он может быть источником такой неприятной ситуации, которая возникла у меня.

Мне нужно какое-то модифицированное зеркало.

Как я понимаю в RAID 1 диски постоянно синхронизируются, и при исправном RAID 1 данные на обоих дисках полностью равны в любой момент времени. Но пусть в модифицированном зеркале будут также два диска, один "ведущий", другой "ведомый". И пусть на "ведомый" данные тоже постоянно копируются в реальном времени постоянно. И в случае выхода из строя "ведущего" диска сервер просто отключается и будет просто недоступен. После того как я обнаруживаю что у меня сервер лежит, выясняем по какой причине он лежит. Если причина - выход из строя ведущего" диска, проверяем актуальность данных на "ведомом", и запускаем сервер с "ведомого".

Возможно ли такое реализовать?

P
На сайте с 16.03.2009
Offline
144
#1

linux mdadm

никаких проблем

ilya_p
На сайте с 12.07.2013
Offline
16
#2

Ответ техподдержки можно перевести так:

С 1 июня на вашем серваке работал только один диск, второй почему-то отвалился. Когда мы, через полтора месяца это просекли, наш технический специалист перепутал диски и восстановил зеркало не с того. Как у него такое вообще могло получиться мы не знаем

AD
На сайте с 30.12.2011
Offline
73
#3

(Добавлю что до этого случая делали проверку дисков и была выявлена неисправность дисков - "статистика дисков SMART показывает наличие ошибок работы с кэшем дисков." Проверку дисков устраивали после того когда сервер пару раз "терял диски". Диски долго собирались заменить и вот дождались.... Сейчас диски заменены.)

---------- Добавлено 20.07.2013 в 17:43 ----------

ilya_p:
Ответ техподдержки можно перевести так:
С 1 июня на вашем серваке работал только один диск, второй почему-то отвалился. Когда мы, через полтора месяца это просекли, наш технический специалист перепутал диски и восстановил зеркало не с того. Как у него такое вообще могло получиться мы не знаем

да, может быть все так, в любой хостинг-компании всем сотрудникам поддержки вообще-то наплевать на ваш сервер, это надо принять как данное.

Потому мне и надо исключить пусть даже ошибку сотрудника в таком случае. Хотя сомневаюсь что сотрудник обнаружил и перепутал, потому что до этого в поддержке мне писали что "мы не следим за вашим сервером, все работы с вашим сервером делаем бесплатно после обращения клиента", и я им верю в этом случае. А аварию с сайтом я обнаружил когда на нем стали красоваться данные за 1 июня.

ilya_p
На сайте с 12.07.2013
Offline
16
#4
AlenDelan:
в поддержке мне писали что "мы не следим за вашим сервером, все работы с вашим сервером делаем бесплатно после обращения клиента", и я им верю в этом случае. А аварию с сайтом я обнаружил когда на нем стали красоваться данные за 1 июня.

Как можно чаще бэкапы на удаленный комп и контроль смарта и раида с извещением по смс

AD
На сайте с 30.12.2011
Offline
73
#5
ilya_p:
Как можно чаще бэкапы на удаленный комп и контроль смарта и раида с извещением по смс

как можно контроллировать смарт и райд? каким средствами? если у меня есть только isp-панель и я чайник:). Ну есть еще конечно доступ по ssh.

ilya_p
На сайте с 12.07.2013
Offline
16
#6
AlenDelan:
как можно контроллировать смарт и райд? каким средствами?

Пф, зависит от того, какая операционка и на чем сделан раид.

AD
На сайте с 30.12.2011
Offline
73
#7

FreeBSD,

райд, скорее всего на дисках SATA, raid 1

ilya_p
На сайте с 12.07.2013
Offline
16
#8
AlenDelan:
FreeBSD

Давно я не лежал в колонном зале)))

если память не изменяет, в бсд софтинка зовется smartmontools

AlenDelan:
не знаю на чем сделан райд, на дисках, raid 1

Раид может быть железной карточкой, типа как видеокарта, к которой подключены диски, а может быть только софтом.

AD
На сайте с 30.12.2011
Offline
73
#9
ilya_p:
Давно я не лежал в колонном зале)))
Раид может быть железной карточкой, типа как видеокарта, к которой подключены диски, а может быть только софтом.

не не, 2 диска SATA по 1 Тб

ilya_p
На сайте с 12.07.2013
Offline
16
#10
AlenDelan:
не не, 2 диска SATA по 1 Тб

Файл /var/run/dmesg.boot в студию

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий