/etc/cron.weekly/99-raid-check: WARNING: mismatch_cnt is not 0 on /dev/md0

N
На сайте с 06.05.2007
Offline
419
#11

myhand, как мы уже выясняли, raid1 читает поочередно с разных блоков. reiserfs ожидает видеть согласованные данные от хранилища нижнего уровня, а не разные. да и любая другая файловая система может быть подвержена тем же проблемам. просто у меня довольно часто перегружался сервер именно с reiserfs. там игнорирование mismatch_cnt гарантированно приводило к проблемам.

Кнопка вызова админа ()
[Удален]
#12

Ребята, спасибо. Но аптайм сервера 200 дней, ребутов даже до этого не делал по пару раз подряд.

M
На сайте с 16.09.2009
Offline
278
#13
n1g3r:
Но аптайм сервера 200 дней, ребутов даже до этого не делал по пару раз подряд.

У вас raid1?

netwind:
myhand, как мы уже выясняли, raid1 читает поочередно с разных блоков.

Все чуть сложнее, вам объясняли как-то.

netwind:
reiserfs ожидает видеть согласованные данные от хранилища нижнего уровня, а не разные. да и любая другая файловая система может быть подвержена тем же проблемам.

В общем, наверное этот сценарий имеет смысл в принципе. С другой стороны, соглассованность данных гарантируется ведением журнала.

Пока все-же больше похоже на проблемы конкретно reiserfs.

netwind:
просто у меня довольно часто перегружался сервер именно с reiserfs. там игнорирование mismatch_cnt гарантированно приводило к проблемам.

Какого рода проблемам, можно подробнее?

Абонементное сопровождение серверов (Debian) Отправить личное сообщение (), написать письмо ().
N
На сайте с 06.05.2007
Offline
419
#14
myhand:
Пока все-же больше похоже на проблемы конкретно reiserfs.

Они полностью прекращаются после внеочередной синхронизаций массива. Я давно эту конфигурацию наблюдаю и знаю о чем говорю. В случае рассинхронизации не работает даже reiserfschk, что означает полную фигню на диске. После синхронизации все нормально становится.

myhand:
Какого рода проблемам, можно подробнее?

например так выглядит


[102486.375622] REISERFS error (device md1): vs-2100 add_save_link: search_by_key ([-1 1802542 0x1001 DIRECT]) returned 1
[102486.381161] REISERFS (device md1): Remounting filesystem read-only
[104091.351195] REISERFS warning (device md1): clm-6006 reiserfs_dirty_inode: writing inode 1676038 on readonly FS
Andreyka
На сайте с 19.02.2005
Offline
822
#15

На мой взгляд лучше два свора на разных дисках чем один в рейде

Так как если ситуация что своп недоступен приходит реже чем проблемы с фс на том же диске

Не стоит плодить сущности без необходимости
N
На сайте с 06.05.2007
Offline
419
#16

Andreyka, это все с какой целью было сказано? своп равномерно распределяется по обоим дискам и в случае полного отказа одного из них с большей вероятностью получите произвольную проблему в редкозапускаемой программе.

Полного и удовлетворительного решения описываемой проблемы нет. Остается искать компромиссы и у каждого они свои. Например, полностью отключить своп для снижения вероятности появления mismatch_cnt. Он в основном не нужен на современных серверах.

M
На сайте с 16.09.2009
Offline
278
#17
netwind:
Они полностью прекращаются после внеочередной синхронизаций массива. Я давно эту конфигурацию наблюдаю и знаю о чем говорю. В случае рассинхронизации не работает даже reiserfschk, что означает полную фигню на диске.

Повторяю, не факт что проблема не связана конкретно с reiserfs.

netwind:
После синхронизации все нормально становится.

В смысле, reiserfschk работает? Я бы не сказал что это "нормально".

Может имеет смысл заменить эту файловую систему?

netwind:

например так выглядит

[102486.375622] REISERFS error (device md1): vs-2100 add_save_link: search_by_key ([-1 1802542 0x1001 DIRECT]) returned 1
[102486.381161] REISERFS (device md1): Remounting filesystem read-only
[104091.351195] REISERFS warning (device md1): clm-6006 reiserfs_dirty_inode: writing inode 1676038 on readonly FS

Выглядит не как проблема с журналом. Что, по-идее - весьма странно.

N
На сайте с 06.05.2007
Offline
419
#18
myhand:
Повторяю, не факт что проблема не связана конкретно с reiserfs.

Если Ганса упекли за решетку, продукт выданный ранее его командой не стал хуже. Код работает и без него. Все остальное - админские суеверия.

myhand:
В смысле, reiserfschk работает? Я бы не сказал что это "нормально".

нет, в некоторых случаях reiserfschk не работает на рассихнронизированном raid1. Совсем ничего не чинит и останавливается. Если синхронизировать, то все работает.

Это вполне нормально и объяснимо. Файловые системы не пишутся из расчета на то, что данные раздела будут случайным образом меняться при считывании.

[Удален]
#19

myhand

Да, raid1.

M
На сайте с 16.09.2009
Offline
278
#20
n1g3r:
Да, raid1.

Тогда "просто забить", увы.

netwind:
Если Ганса упекли за решетку, продукт выданный ранее его командой не стал хуже. Код работает и без него.

Плохая, негодная телепатия. Я вовсе никак не связывал качество кода с арестом кого-либо.

Файловая система в ядре - значит кто-то ее сопровождает. Я даже знаю как узнать кто ;)

Все это, однако, не гарантирует безошибочность ее работы и отсутствие багов в самой FS или утилитах.

netwind:
Если синхронизировать, то все работает.

Ага. А не потеряли-ли вы в процессе этого счастья какие-то данные?

netwind:
Файловые системы не пишутся из расчета на то, что данные раздела будут случайным образом меняться при считывании.

А данные и не должны так меняться, если FS их правильно записала. Операция либо доведена до конца - либо все связанные с ней "данные" просто невалидны. В этом смысл журналирования.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий