myhand

Рейтинг
278
Регистрация
16.09.2009
Pilat:
Обязательно.

Ну, нужно же было подумать о реальной проверке работы программы.

Pilat:
Мы же суспендим для получения бэкапа, то есть простой будет, вполне вероятно, несколько минут

Вам выше пишут - суспенд занимает секунды, а вы опять...

Pilat:
Да, внимательно прочитав - не то. К бэкапу вообще никаким боком не относится, кстати.

Относится. В той же степени, что и снапшоты на всяких LVM, как и суспенд vps и т.п. Не так много вещей в мире Linux есть, которые гвоздями прибиты к какому-то специфическому use-case.

Pilat:
Простейший пример - если в очереди постфикса лежит письмо, то есть хорошие шансы, что отправитель после восстановления из бэкапа получит сообщение о недоставке.

Это вам надо vps на несколько суток завалить (4-5 дней по RFC, если правильно помню). Я бы сразу сказал вам - это случай, когда проблемы у вас будут посерьезнее одного недоставленного письма 😂

Pilat:
Если что-то типа monit настроено на реакцию на одно пропущенное событие, тоже, я думаю, может что-то не то сделать.

Начнем с того, что реакция на одно событие - моветон. Приемлемо, если это предупреждение или новая проверка события (вне очереди и т.п.) - но не более. Во-вторых - откуда вообще "пропуск"? Что-то похожее вашему описанию можно в monit сделать через внешние (exec) чекреры, с "памятью" - причем явно глючные.

Pilat:
Если в какой-то программе есть вычисление среднего за текущий и предыдущий интервал - будет падение показателей.

А по описанию - больше похоже на баг...

Pilat:
ntpd не на пустом месте возник.

И каким боком тут синхронизация? Время должно быть правильным, его *коррекция* должна происходить плавно. Это вовсе не означает, что приложения не могут получать здорово различающиеся показатели временных меток в течение их неприрывного снятия. Да запросто - SIGSTOP+SIGCONT. Если от этого программа сходит с ума - давно пора отдать на живодерню ее пейсателя.

doopler:
По второе, мне почему-то не понятно где здешние модераторы форума?

Да здесь, неподалеку - вы не волнуйтесь. Санитары!!!

doopler:
Оскорбляете и принижаете способности не только меня, но и каждого кто пишет в темах.

Повторюсь - ни у кого нет цели "принижать ваши способности". Они всем видны - о каком изучении TCP/UDP/IP может идти речь, когда вы легенду к графику перевести не удосужились, прежде чем "вопросы" задавать?

doopler:
Более чем уверен, что при желании, смогу объяснить вам на пальцах даже очень сложные физиологические или биохимические процессы человеческого тела.

Нам про клеточное дыхание расскажите, пожалуйста.

Pilat:
suspend не позволяет сохранить состояние VPS полностью - работающие процессы либо должны уметь опознавать выход из suspend, либо будут сохранять некорректные данные, хотя бы из-за неизбежного скачка времени и разорванных соединений.

Просто они должны работать корректно - и никаких "опознаваний" не надо. "Скачок времени" о котором вы говорите - можно устроить обычным SIGSTOP. Разорванные соединения - ничего необычного (да и не будет их для TCP за такое время).

Pilat:
CRIU - это как раз то о чём я писал, и не "есть", а "будет" через несколько лет.

Неправда, не то. И оно *уже* есть.

Andreyka:
А еще можно просто сделать локинг в mysql и sync перед саспендом. Потом локинг снять.

Речь шла о бекапе vps в целом. А не о том как бекапить внутри vps отдельно стоящие приложения.

Хостер по определению не должен расчитывать на то что там хозяин vps запустил. Может быть что угодно, это понятно?

Pilat:
watchdog... Засуспенденный бэкап, после восстановления, такую программу с большой вероятностью перезапустит, несмотря на то что она, возможно, выполняла критическую операцию.

Можно смело увольнять администратора за криво настроеный "watchdog". Объяснять почему?

Pilat:
Две минуты на суспенд - и соединения отвалятся. Много ещё можно чего вспомнить.

Начните с того, что вспомните откуда эти ваши "две минуты" вновь появились.

Pilat:
На самом деле останавливать либо как-то готовить к бэкапированию надо - даже база данных как-то должна сбросить все буферы на диск.

Это уже для взрослых :) Речь зашла о бекапе VPS в целом.

Pilat:
а вот для postgresql или innodb, где потерь не должно быть вообще, это актуально. (речь не идёт о целостности базы данных, скорее о целостности данных приложений в базе данных).

Состояние vps целиком дампится после suspend. Какие еще потери?

Pilat:
В Windows давно есть интерфейс оповещения приложений о необходимости сохранить данные, к сожалению линуксовый мир до этого только начинает доходить.

Надеюсь, до подобного маразма все-таки дело не дойдет. Зато у нас есть CRIU.

Pilat:
Останавливать виртуалки приходится, например, из-за того, что раздел LVM с виртуалками содержит и место для бэкапа

Ну так я и говорю - из-за чьей-то глупости.

TF-Studio:
Я не ищу конкретное решение проблемы, я ищу вектор и исполнителя, который мне все наладит.

Обращайтесь. Контакты в подписи.

Собственно, решение вам полностью подсказали в первых двух постах. Сменят *диск* - будете дальше действовать по обстоятельствам.

Pilat:
Даже если делать бэкап после shutdown (что вообще говоря правильно, но не слышал чтобы кто-то так делал)

Еще-бы. Бедные клиенты были бы...

Регулярные минуты простоя - это заметно и это много.

Pilat:
то есть downtime как раз несколько минут.

Ну, о минутах, собственно и писали выше. Речь зашла о том, что минуты эти - от безграмотности. Нет никакой необходимости останавливать сервер на такое время.

madoff:
ls -la /var/www/rafer535/data/

Вывод покажите

Видать, надолго ты его подвесил 😂

Диски в зеркалах что-ли? А чего так здорово производительность отличается? Так что помимо смарт статистики - посмотрите еще модели, что вам поставили (sdb работает ощутимо медленнее).

Но раз "началось после переезда" - значит и дело в переезде. Если заменой диска это не вылечится - оптимизируйте ПО или меняйте серверную конфигурацию далее.

madoff:
myhand - угу с умным, только вот надо обучать

Ну вот тебе конкретный вопрос задали - валяй, обучай. Хочу это видеть.

Да и хостеру ТС будет чем ткнуть - иш, подлец, "не предоставляет в полном объеме" (ц).

madoff:
Я представляю, чел не шарит, но хочет факт проблемы показать хостерам упертым

Так нет у человека проблемы. Кроме той, что поставил munin - теперь графики рассматривает...

madoff:
у тебя не помощь а сначала "тыканье" в два топика а после что-то конструктивное.

Во-первых, я и не подписывался ТС что-то объяснять - это сделал ты. Вот и отвечай за слова ;)

madoff:
после что-то конструктивное

Попугаеметр для конструктивности ты где-то вдали забыл...

madoff:
Если видно что человек не шарит

На это прямо ему и указать, да. С умным человеком может быть более чем конструктивно, поверь.

Всего: 4890