ситуацию, когда на диске записано черти что, но носитель ведет себя адекватно исходя из описанных предположений, программисты reiserfs все-таки предусмотрели. ---------- Добавлено в 23:05 ---------- Предыдущее сообщение было в 23:05 ----------
да, я же писал про то, что не грузилось. ---------- Добавлено в 23:14 ---------- Предыдущее сообщение было в 23:05 ----------
Я правильно понимаю, что ваше предположение подразумевает, что reiserfs "сам себя рушит" и в следствии ошибок в коде записывает на разные диски md разную информацию?
не единственное.---------- Добавлено в 22:43 ---------- Предыдущее сообщение было в 22:41 ----------
должен. я либо вынимаю диск, либо запускаю синхронизацию и второй диск сразу же перестает использоваться для чтения.
Это невозможно сделать в приложении. Старательно построенные программистами абстракции тщательно скрывают такие тонкости. Они всплывают только случайно, как в описываемом случае.
мне достаточно того, что вы перестанете гнать хулу на рейзерфс и признаете свои доводы неверными.
а по-моему очень глобально и надежно. просто проверять придется чаще.
тем, что reiserfschk и все остальные части reiserfs написаны исходя из допущения, что устройство адекватно себя ведет: повторные чтения одного и того же блока выдают одну и ту же информацию, а не различную.
делаем нормальный массив и reiserfschk нормально работает.
там написано слово "будет" - это предложение как избежать подобной проблемы разработчикам.
Так почему именно синхронизация массива приводит к тому, что reiserfschk начинает работать нормально, а не останавливается как до синхронизации?
меня не устраивает ответ "значит так пишет". это нелогично. файловая система не может ничего знать о нижележащем уровне абстракции и что там вообще в md творится.
хотя я и не проверял другую fs, но выбор fs не должен влиять на md.
вы там написали "md при repair просто выберет один блок случайным образом".
я думал уже другую ситуацию обсуждаете.
в тот момент когда вынул один из дисков в одном случае и запустил синхронизацию насильно в другом.
согласно mcelog, вроде нет, хотя мне не удалось добиться от вендора ответа и я плюнул. к тому же по полгода работает без проблем. Память правда не ECC.
при внезапной перезагрузке любой raid1 будет считаться грязным и поэтому работа будет идти только с одним диском.
допустим, ваша трагедия понятна. ну а от меня то вы что хотите?
поставьте нормальный raid с батарейкой.
В md так делать не надо. Нужно пометить диск как свободный. Потом подать команду на отключение в порт sata и уже потом выдергивать.
написано, что для raid1 выбирается первый For RAID1, this involves copying the contents of the first drive onto all other drives.
выглядит как бред.
Если штатно или по команде от ups, то все нормально.
допустим, около 15 раз за 3 года. Проблема с железом, но менять материнку накладно будет.
Скорее всего, сделан выбор в пользу производительности. Вместо того чтобы проконтролировать ответ от обоих дисков на команду записи метки и только потом писать данные, выбрали просто запись всех команд подряд чтобы ncq раскидал там уже.
еще можно любой примонтированный md считать грязным, тогда наверное это решит проблему 100%, но приведет к слишком частым проверкам.
Raistlin, ну что вы как маленький - тогда ups с уведомлением сделайте.
Raistlin, не нажимай на резет и все.