suspend не позволяет сохранить состояние VPS полностью - работающие процессы либо должны уметь опознавать выход из suspend, либо будут сохранять некорректные данные, хотя бы из-за неизбежного скачка времени и разорванных соединений. ыгызутв - это просто компромисс.
---------- Добавлено 20.12.2012 в 05:14 ----------
CRIU - это как раз то о чём я писал, и не "есть", а "будет" через несколько лет.
На самом деле останавливать либо как-то готовить к бэкапированию надо - даже база данных как-то должна сбросить все буферы на диск. Это малоактуально для виртуалок с mysql+isam - там и так бардак, пара потерянных записей погоды не меняют, а вот для postgresql или innodb, где потерь не должно быть вообще, это актуально. (речь не идёт о целостности базы данных, скорее о целостности данных приложений в базе данных).
В Windows давно есть интерфейс оповещения приложений о необходимости сохранить данные, к сожалению линуксовый мир до этого только начинает доходить.
Останавливать виртуалки приходится, например, из-за того, что раздел LVM с виртуалками содержит и место для бэкапа - например proxmox по умолчанию так и делает, и создание LVM снапшотов не работает, а qcow снапшоты, кажется, ещё для бэкапирования использовать не научились. Пока нет внешнего хранилища для бэкапов, придётся останавливаться.
C какого перепугу? В KVM есть минимум два способа сделать снапшот образа диска запущенной машины, можно сделать suspend, можно остановить. Даже если делать бэкап после shutdown (что вообще говоря правильно, но не слышал чтобы кто-то так делал), всё равно разумно предположить что после shutdown тут же делается снапшот средствами операционной системы и тут же запуск, то есть downtime как раз несколько минут.
Это может быть и по причине нехватки памяти и как результат убивание системой некоторых процессов для освобождения памяти. Если в число убитых попадёт ssh и apache (я такое видел), полная иллюзия недоступности сервера (собственно он недоступен и есть). Почему памяти не хватает - вопрос неоднозначный. Так что стоит аккуратно разобраться в чём причина.
Кстати, ТС ответами и не интересуется, похоже.---------- Добавлено 19.12.2012 в 15:07 ----------
Ещё можно сделать снапшот какими-нибудь средствами.
всё же интересно, /proc/user_beancounters мы увидим? (после некоторой работы системы, не сразу после перезагрузки)
Что будет с иксовым сеансом при кратковременном разрыве связи? И что c rdp?
неужели у него все сразу отваливаются? Или может только одна какая-то? Сначала надо понять что происходит.
Куда бежать, зачем бежать?
Гора родила мышь.
как раз окажется, что на купленном железе заработает только одна какая-нибудь платформа, вот и выбор будет попроще...