Raistlin

Raistlin
Рейтинг
247
Регистрация
01.02.2010

netwind, И. И, если что, такой рейд не рейд, если он не удовлетворяет элементарным требованиям безопасности - значит, нужно изобретать что-то другое. Думаю, ясно, почему я спрашиваю? Мне хочется разобраться в проблеме и понять, как от этого можно застраховаться, т.к. в моём случае такое поведение выбранного мной ПО (mdadm) просто недопустимо, т.к. противоречит элементарным требованиям целостности данных.

netwind:
как вы объясните, что после синхронизации массива или выдергивании одного диска, так же самая команда reisefschk с теми же самыми ключами все-таки нормально ее исправляет ? причем тут журнал?

Вот это-то я считаю, как раз невозможным. Можете детализировать ОС и версию mdadm?

myhand:
То, но "все немножко не так" (с) - обсудили выше.

Да, уже прочитал. Ладно, момент мне ясен, квалификацию повысил. Но одного понять всё же не могу - как может оказаться рейд рассинхронизирован после ребута, но md этого не заметит. Не понимаю.

myhand:
"Рассинхронизированность" возникает постоянно в raid1, при самой обычной работе, в разных сценариях (swap, mmap, etc).

В том и дело, что рассинхронизированность - в кавычках, и mdadm об этом знает и устранит, как только освободится i/o. И пока не устранит - массив не может быть помечен как clean...

myhand,

the md driver marks an array as "dirty"

before writing any data to it, and marks it as "clean" when the array

is being disabled, e.g. at shutdown. If the md driver finds an array

to be dirty at startup, it proceeds to correct any possibly inconsis-

tency. For RAID1, this involves copying the contents of the first

drive onto all other drives.

Это из мана. Я не то прочитал?

netwind:
я после резета ничего не вижу, на то он и резет.

Перечитайте еще пару раз до просветления.

---------- Добавлено в 20:20 ---------- Предыдущее сообщение было в 20:19 ----------

netwind:
Разумеется, любой разумный человек будет запускать процесс для бекапа с классом idle, а остальные без ionice. Что в этом сценарии неправильно? Как заставить ionice работать?

мдэ. Вы вот запустите вообще ВСЕ дисковые операции с idle. Намёк понятен?

myhand:
Это вообще к кому вопрос был?

К проблемам с рейзерфс. Ну мдадм после резета заново синхронизирует рейды вообщет. И там два диска ну никак не могут быть в рейде - система читает с одного пока данные не синхронизированы.

---------- Добавлено в 20:16 ---------- Предыдущее сообщение было в 20:14 ----------

netwind:
Если raid "не знает" что он рассинхронизирован, то будет происходить чтение с с обоих дисков. Ошибки на уровне md не возникает.

После резета рейд по-умолчанию считает, что он рассинхронизирован. Никогда во время выключения не видели строчку "stopping all md devices - ok" ? Как раз для того, чтобы он при загрузке не начал синхронизацию. А резет этого не делает.

Объясните мне, как это у вас на рассинхронизированном рейде1 происходит чтение с обоих дисков и один из них не вылетает в фэйл?

Здесь нет офф. поддержки. Я вижу проблему и пытаюсь её решить.

Raistlin добавил 16.12.2011 в 15:08

Проблема решена. Простой составил около 2 часов.

Не. Я не понял... Кто работает с сервером, с железом НА ПОЛУ? И как это работают с сервером, но чтобы сайты не выключатЬ? Мне весело, ей-богу. Если навернулось железо - вы его или меняете или тестите, не вынимая из стойки. Есть такие вещи, как PXE, в конце концов сидюк на этом сервере есть почти наверняка. Ну, а если заменили HDD и не уверены, что он здоровый - весьма удивительно, почему перед этим не протестировали HDD?

Raistlin добавил 15.12.2011 в 05:29

P.S> ладно, пусть сервер лежит на полу. Но зачем в онлайн это транслировать - не понятно...

Pilat:
А Вы видели на практике это замедление?

видел.

Rimlyanin:
И нормальный контроллер рейда, не получив от диска никакого ответа за определённое время пометить его как битый....

Верно.

Rimlyanin:
В отличии от RE винтов, который, отрапортовав об ощибке, продолжает работать в рейде, ожидая что контроллер даст ему время и команду на исправление сектора...

Чего софтовый рейд не делает.

Всего: 4674