Спрашивайте reiserfschk, а точнее reiserfschk - Администрирование серверов

/etc/cron.weekly/99-raid-check: WARNING: mismatch_cnt is not 0 on /dev/md0

n1g3r · 2011-12-11T08:54:29.0000000Z

Каждую неделю вываливается такое сообщение-ошибка. Количество не синхронизированных блоков всегда разное. Примерно 8-10к. Что много. Панелька isp. Такое чувство, что ошибка вылазит после бекапа. Ручками делаю синхронизацию - все ок. С блинами проблем нету. Но каждую неделю вручную делать синхронизацию - тоже не выход. У кого были или есть такие проблемы и как их решали? Центос 5 стоит.

247

Raistlin

18 декабря 2011, 17:29

#81

myhand:
Можете просветить нас подробнее насчет "ясности". Можно даже по-буржуйски

дма-запись на винты. В разный момент времени там могут быть разные данные. Т.е. при работе массива они там на винтах не синхронны, например это своп, частоизменяемый файл, прерванная запись. собственно, это и есть в цитате. При потере питания это может быть фатально...

---------- Добавлено в 00:29 ---------- Предыдущее сообщение было в 00:28 ----------

netwind, да ничего я от вас не хочу. Нужны вы мне. Можете спать идти.

HostAce - Асы в своем деле (http://hostace.ru)

Своп файл: что лучше Где хранить бэкапы - Немного про nginx

N

419

netwind

18 декабря 2011, 17:35

#82

myhand:
Речь ведь у вас шла о "чистом" массиве, или уже забыли?

вы там написали "md при repair просто выберет один блок случайным образом".

я думал уже другую ситуацию обсуждаете.

myhand:
Почему "принципиальная проблема md" - не бред? Где вы исключили reiserfs?

в тот момент когда вынул один из дисков в одном случае и запустил синхронизацию насильно в другом.

Но не память?

согласно mcelog, вроде нет, хотя мне не удалось добиться от вендора ответа и я плюнул. к тому же по полгода работает без проблем. Память правда не ECC.

myhand:
Каким образом "решит" - потерей данных случайным образом?

при внезапной перезагрузке любой raid1 будет считаться грязным и поэтому работа будет идти только с одним диском.

Кнопка вызова админа ()

TrueVDS - достоверно о Luckhost.net Удачный хостинг, для Напиться с горя, что-ли?

247

Raistlin

18 декабря 2011, 17:36

#83

myhand:
Отказала фантазия?

вы предлагаете держать тонну контроллеров и запчасти к ним? Или что делать с этим барахлом, когда через 5 лет выйдет из строя контроллер? закупать еще 2 новых? та не вопрос. Прошу понять, что под надежностью понимается не только вероятность выхода из строя детальки, но так же вероятность проблем любых.

Партизанск Телеком умер? Ответственность хостера HP vs "самосбор".

M

278

myhand

18 декабря 2011, 17:39

#84

Raistlin:
дма-запись на винты. В разный момент времени там могут быть разные данные. Т.е. при работе массива они там на винтах не синхронны, например это своп, частоизменяемый файл, прерванная запись. собственно, это и есть в цитате.

Проблема в том, что "цитата" не сводится к простому упоминанию "вумного слова". Дело вовсе не в DMA, а в том как система работает в подобном сценарии.

С метаданными fs такого, по идее, случиться не должно.

Абонементное сопровождение серверов (Debian) Отправить личное сообщение (), написать письмо ().

247

Raistlin

18 декабря 2011, 17:39

#85

netwind:
при внезапной перезагрузке любой raid1 будет считаться грязным и поэтому работа будет идти только с одним диском.

нет. Об этом написано в мане. нет.

247

Raistlin

18 декабря 2011, 17:44

#86

myhand:
С метаданными fs такого, по идее, случиться не должн

какая разница? Метаданные - те же часто меняющиеся данные. И не важно, файл это или нет.

myhand:
Проблема в том, что "цитата" не сводится к простому упоминанию "вумного слова". Дело вовсе не в DMA, а в том как система работает в подобном сценарии.

Я разве сказал, что дело только в дма? Кстати, это не является проблемой в обычном случае. От обрыва питания рейд спасать и не должен, а представить проблему в другом случае мне пока не удается. Свопа в правильно настроенной системе быть не должно. Как и прерванной записи. А если приложение по несколько раз в секунду пишет один и тот же файл - с ним что-то не то...

Своп файл: что лучше ФО Easy-Share - скачки, Индексация динамических страниц

M

278

myhand

18 декабря 2011, 17:52

#87

netwind:
вы там написали "md при repair просто выберет один блок случайным образом".

Ну, в этом случае также получится случайно. Мы же не всегда записали нужные блок на "первый диск"?

netwind:
в тот момент когда вынул один из дисков в одном случае и запустил синхронизацию насильно в другом.

fs никуда не делась. Статистика у вас не ахти большая - так что увы.

netwind:
при внезапной перезагрузке любой raid1 будет считаться грязным и поэтому работа будет идти только с одним диском.

Нет, объясняли же. Рейд считается "грязным" (грубо говоря) пока на него что-то пишет. Есть немалая вероятность "попасть" в момент, когда все чисто. Особенно, если система нагружена слабо.

Raistlin:
вы предлагаете держать тонну контроллеров и запчасти к ним? Или что делать с этим барахлом, когда через 5 лет выйдет из строя контроллер? закупать еще 2 новых? та не вопрос. Прошу понять, что под надежностью понимается не только вероятность выхода из строя детальки, но так же вероятность проблем любых.

Гарантия. Бекап. Цена контроллера << стоимости данных.

Raistlin:
какая разница? Метаданные - те же часто меняющиеся данные. И не важно, файл это или нет.

Важно. Система с метаданными fs, с ее журналом - должна работать иначе. Ее драйвер явно будет интересовать в нужных местах: что данные записаны.

Так что увы, пока незачет. Только словечки знакомые углядели - перевод не осилили ;)

Raistlin:
От обрыва питания рейд спасать и не должен

Вообще-то - должен. В том смысле, что хоть не должен допускать скрытой рассинхронизации массива.

Raistlin:
Свопа в правильно настроенной системе быть не должно.

Должен. Программы люди пишут, а не олимпийские боги.

Raistlin:
А если приложение по несколько раз в секунду пишет один и тот же файл - с ним что-то не то...

"Вы мне запрещаете?" // mysql

Своп файл: что лучше Вопрос к Хостерам. И SEO текст под спойлером

N

419

netwind

18 декабря 2011, 18:01

#88

myhand:
при внезапной перезагрузке любой raid1 будет считаться грязным и поэтому работа будет идти только с одним диском.

там написано слово "будет" - это предложение как избежать подобной проблемы разработчикам.

Так почему именно синхронизация массива приводит к тому, что reiserfschk начинает работать нормально, а не останавливается как до синхронизации?

меня не устраивает ответ "значит так пишет". это нелогично. файловая система не может ничего знать о нижележащем уровне абстракции и что там вообще в md творится.

хотя я и не проверял другую fs, но выбор fs не должен влиять на md.

Снова сдох диск у Проблема с жестким диском TransIndex-Увеличьте свой трафик всего

M

278

myhand

18 декабря 2011, 18:17

#89

netwind:
там написано слово "будет" - это предложение как избежать подобной проблемы разработчикам.

я уже объяснял вам, что это "предложение" - создать другую проблему, похлеще?

netwind:
Так почему именно синхронизация массива приводит к тому, что reiserfschk начинает работать нормально, а не останавливается как до синхронизации?

Спрашивайте reiserfschk, а точнее reiserfs.

Интересно, а как вы объясняете то, что синхронизация массива вам всегда помогает?

netwind:
хотя я и не проверял другую fs, но выбор fs не должен влиять на md.

Если в работе fs нет ошибок.

Что Вы думаете об Сделаю сайт на Joomla «Закладочник» и BmSubmitter -

N

419

netwind

18 декабря 2011, 18:29

#90

myhand:
я уже объяснял вам, что это "предложение" - создать другую проблему, похлеще?

а по-моему очень глобально и надежно. просто проверять придется чаще.

myhand:
Интересно, а как вы объясняете то, что синхронизация массива вам всегда помогает?

тем, что reiserfschk и все остальные части reiserfs написаны исходя из допущения, что устройство адекватно себя ведет: повторные чтения одного и того же блока выдают одну и ту же информацию, а не различную.

делаем нормальный массив и reiserfschk нормально работает.

Как оценить эффективность СЕО Статьи VS ссылки? XAP-3 Как быстро поднять

Как снизить ДРР до 4,38% и повысить продажи с помощью VK Рекламы

Open AI тестирует память для ChatGPT

/etc/cron.weekly/99-raid-check: WARNING: mismatch_cnt is not 0 on /dev/md0