/etc/cron.weekly/99-raid-check: WARNING: mismatch_cnt is not 0 on /dev/md0

M
На сайте с 16.09.2009
Offline
278
#61
netwind:
причем тут телепатия? два человека написали вам - не помогает.

Один - не написал что он делал кроме безумного изменения расписания. Другой - просто продолжает тупить.

netwind:
Ну можно же использовать не произвольный, а специальный.

Например?

netwind:
Кстати, синхронизация и проверка md происходит с ограничением по скорости именно поэтому.

Почему вы так уверены, что нет иных причин? Нагрузка достаточно специфичная.

netwind:
Можно еще забыть про шедулер дисковых операций - для ionice не нужно использовать deadline.

Вот это, кстати, полезно что напомнили. Сам ionice не ругается, даже если шедулер не поддерживает приоритизацию.

netwind:
Что есть md driver marks an array as "dirty" ? запись специальной метки на оба диска.

В суперблок пишется, насколько я понимаю.

netwind:
Драйвер md, похоже, просто посылает команды на нижний уровень, но результат и очередность не контролирует.

Это была бы русская рулетка (при письме!), а мы таки о райд говорим ;) Слишком наивная точка зрения - не думаю что все настолько плохо.

netwind:
Хотя в мане не акцентирован этот момент, но метка не записана туда постоянно как только смонтирован raid.

Ман, к сожалению, мягко говоря - не идеален. На самом деле dirty помечается массив только пока данные туда актуально не записаны. Ничего не пишем - все вновь чисто.

netwind:
Если у вас есть другое объяснение почему до синхронизации массива reisefschk завершается с ужасной ошибкой, а после синхронизации точно такая же команда работает - расскажите.

Вам все уже объяснили. Источник проблемы - чтение рассинхронизированного массива, а во-вторых - конкретная fs. Так она контролирует целостность журнала и данных.

Абонементное сопровождение серверов (Debian) Отправить личное сообщение (), написать письмо ().
N
На сайте с 06.05.2007
Offline
419
#62
myhand:
Например?

У меня меня есть такой скрипт. Пусть называется superpuperslowbackup.

myhand:
Вам все уже объяснили. Источник проблемы - чтение рассинхронизированного массива, а во-вторых - конкретная fs. Так она контролирует целостность журнала и данных.

Предполагалось, что объясните откуда при внезапной перезагрузке возникает рассинхронизированность не заметная md , учитывая что специальные действия против этого драйвер md все-таки делает.

А файловая система ничего не знает о нижележащем устройстве. Последовательные запуски reiserfschk без синхронизации устройства не приводят к успеху.

Кнопка вызова админа ()
Raistlin
На сайте с 01.02.2010
Offline
247
#63

myhand,

the md driver marks an array as "dirty"

before writing any data to it, and marks it as "clean" when the array

is being disabled, e.g. at shutdown. If the md driver finds an array

to be dirty at startup, it proceeds to correct any possibly inconsis-

tency. For RAID1, this involves copying the contents of the first

drive onto all other drives.

Это из мана. Я не то прочитал?

HostAce - Асы в своем деле (http://hostace.ru)
M
На сайте с 16.09.2009
Offline
278
#64
netwind:
У меня меня есть такой скрипт.

Как андрейка. "Знаю/имею, но не скажу/покажу" - на поверку знаний и умений пшик. Т.е. конкретного рецепта нет. Так и напишите.

netwind:
предполагалось, что объясните откуда при внезапной перезагрузке возникает рассинхронизированность не заметная md

"Рассинхронизированность" возникает постоянно в raid1, при самой обычной работе, в разных сценариях (swap, mmap, etc). Вы совершенно произвольно связали ее с перезагрузкой. "По идее" - ничего плохого от этого не должно быть.

Возможно, ваш сценарий - обычный крах fs, не использующей барьеров (коммит записался вперед журнала). Включите - на новых ядрах должно помочь (правда "цена" может не понравиться).

Raistlin:
Это из мана. Я не то прочитал?

То, но "все немножко не так" (с) - обсудили выше.

netwind:
Последовательные запуски reiserfschk без синхронизации устройства не приводят к успеху.

Забавно, что после синхронизации он у вас все чинит всегда. Я правильно понял?

Raistlin
На сайте с 01.02.2010
Offline
247
#65
myhand:
То, но "все немножко не так" (с) - обсудили выше.

Да, уже прочитал. Ладно, момент мне ясен, квалификацию повысил. Но одного понять всё же не могу - как может оказаться рейд рассинхронизирован после ребута, но md этого не заметит. Не понимаю.

myhand:
"Рассинхронизированность" возникает постоянно в raid1, при самой обычной работе, в разных сценариях (swap, mmap, etc).

В том и дело, что рассинхронизированность - в кавычках, и mdadm об этом знает и устранит, как только освободится i/o. И пока не устранит - массив не может быть помечен как clean...

N
На сайте с 06.05.2007
Offline
419
#66
myhand:
Как андрейка. "Знаю/имею, но не скажу/покажу" - на поверку знаний и умений пшик. Т.е. конкретного рецепта нет. Так и напишите.

Понимаю ваше недоверие, но зачем же я буду выкладывать свои разработки просто так.

В качестве примера реальной необходимости ограничения скорости в других программах посмотрите как это сделано в xtrabackup


Возможно, ваш сценарий - обычный крах fs, не использующей барьеров (коммит записался вперед журнала). Включите - на новых ядрах должно помочь (правда "цена" может не понравиться).

как вы объясните, что после синхронизации массива или выдергивании одного диска, так же самая команда reisefschk с теми же самыми ключами все-таки нормально ее исправляет ? причем тут журнал?

Забавно, что после синхронизации он у вас все чинит всегда. Я правильно понял?

нет, только если не загрузилось. быстрый способ загрузить - выдернуть один диск. Я таких всего два случая могу припомнить с этой машиной. Еще один когда она нормально загрузилась, но потом при работе вылезли ошибки в dmesg, которые я показывал.

Гораздо чаще после перезагрузки детектирует грязную метку и нормально грузится с первого диска. Остальные в похожих конфигурациях на reiserfs просто не перегружаются внезапно.

Raistlin
На сайте с 01.02.2010
Offline
247
#67
netwind:
как вы объясните, что после синхронизации массива или выдергивании одного диска, так же самая команда reisefschk с теми же самыми ключами все-таки нормально ее исправляет ? причем тут журнал?

Вот это-то я считаю, как раз невозможным. Можете детализировать ОС и версию mdadm?

N
На сайте с 06.05.2007
Offline
419
#68
Raistlin:
Вот это-то я считаю, как раз невозможным. Можете детализировать ОС и версию mdadm?

ubuntu 10.04 LTS. и? проявлялось и на более старых версиях. я считаю это принципиальная проблема md.

Raistlin
На сайте с 01.02.2010
Offline
247
#69

netwind, И. И, если что, такой рейд не рейд, если он не удовлетворяет элементарным требованиям безопасности - значит, нужно изобретать что-то другое. Думаю, ясно, почему я спрашиваю? Мне хочется разобраться в проблеме и понять, как от этого можно застраховаться, т.к. в моём случае такое поведение выбранного мной ПО (mdadm) просто недопустимо, т.к. противоречит элементарным требованиям целостности данных.

N
На сайте с 06.05.2007
Offline
419
#70

Raistlin, не нажимай на резет и все.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий