Pilat

Рейтинг
250
Регистрация
08.03.2007
LaYF:
Были бы они такие миленькие :)
Либо ты заплатишь либо мы забираем компьютер. Тупые, отличие между ПК и с сервером не шуруют

Тупые потому что не понимают, что за сервер можно было бы и 100 запросить?

ТС, Вам надо не форумных "админов" спрашивать, а нанять одного хорошего, чтобы он разобрался. По данным, которые Вы представили, никаких разумных выводов сделать нельзя. Хотя Ваши слова "Меня вот смущают слова реселлера - "Отправили сервер на перезагрузку." т.е, он не сам, а его через панельку перезагрузили, получается." .. "У реселлера стоит какой-то мониторинг и перегружает автоматом. Договорился,что бы не перегружали и посмотрели через KVM" настораживает. Ваш сервер перегружает реселлер, а зачем он это делает Вы решили спросить на сёрче?

hosting_manager:
Hetzner на самом деле не такой уж дешевый
...
десктопное железо часто выходит из строя либо его производительность итоговая далека от ожидаемой
...
маленькое упоминание, что там всего лишь 10 ТБ трафика
...
За отстойный шаредный гигабитный порт

И после этих красивых слов видим :

hosting_manager:

Если Вы действительно планируете серьезный проект - размещайте его в нормальном Дата Центре

Наверно, имеется ввиду хостинг, упомянутый в подписи - http://ua-hosting.com.ua . Сверхнадёжный, с надёжностью аж... 94% за год! Такого вообще никто кроме домашних датацентров не предоставляет. Как только язык поворачивается хаять других.

Хотя, конечно, хетзнер рассчитан на не сильно крупные проекты, наверно. Но в отличии от некоторых он детально описывает условия. Большими буквами, без хитростей типа


VIP-хостинг специально разработан для крупных интернет-проектов...
Мы уверены в надежности нашего оборудования и готовы гарантировать 99,5 %* доступность сервера из сети в любой календарный месяц.

Пока не появится понимание, что облачный хостинг стоит не дешевле обычного, связываться с ним смысла не имеет.

Уважаемые, детский сад этот ещё не надоел?

Если Вы не можете сами найти мануал, то лучше не пытаться. Арендуйте другой сервер и на нём всё настраивайте.

Теоретически на Debian Squeeze можно установить Proxmox - инструкция есть на офсайте, но раз Вы даже название дистрибутива не сообщаете, то есть не понимаете что это имеет значение, то на живом сервере экспериментировать не стоит.

doopler:
По третье, тема слегка ушла в сторону..

А мне дискуссия даже начала больше нравиться. Я, правда, не знаю что такое циалкелия, но всё равно интересно.

myhand:

Вам выше пишут - суспенд занимает секунды, а вы опять...

суспенд - секунды, после него для замороженной машины делается бэкап, а это не секунды.

myhand:

Относится. В той же степени, что и снапшоты на всяких LVM, как и суспенд vps и т.п. Не так много вещей в мире Linux есть, которые гвоздями прибиты к какому-то специфическому use-case.

Вот как раз Parallels писала, что их интересует в основном для конкретного use-case, и работали они над CRIU в основном для миграции. Но если Вы приведёте пример бэкапных программ, использующих CRIU, все будут только очень рады.

myhand:

Это вам надо vps на несколько суток завалить (4-5 дней по RFC, если правильно помню). Я бы сразу сказал вам - это случай, когда проблемы у вас будут посерьезнее одного недоставленного письма 😂

Речь шла про сценарий делаем бэкап работающей машины ... проходит неделя... сервер накрылся... восстанавливаем недельный бэкап... proxmox рассылает предупреждения о недоставленной почте, отправители в шоке.

myhand:

Начнем с того, что реакция на одно событие - моветон. Приемлемо, если это предупреждение или новая проверка события (вне очереди и т.п.) - но не более. Во-вторых - откуда вообще "пропуск"? Что-то похожее вашему описанию можно в monit сделать через внешние (exec) чекреры, с "памятью" - причем явно глючные.

моветон или нет - не важно. Есть системы, в которых один пропуск события требует посылки сообщения что событие пропущено и разбирательство почему пропущено.

myhand:

А по описанию - больше похоже на баг...
И каким боком тут синхронизация? Время должно быть правильным, его *коррекция* должна происходить плавно. Это вовсе не означает, что приложения не могут получать здорово различающиеся показатели временных меток в течение их неприрывного снятия. Да запросто - SIGSTOP+SIGCONT. Если от этого программа сходит с ума - давно пора отдать на живодерню ее пейсателя.

Описанное мной поведение postfix ещё оставляет вопросы? postfix на живодёрню? Кстати, ситуация с временными прыжками встречалась, судя по гуглю, в cacti. Тоже на мыло? И совсем не обязательно программе сходить с ума, она может просто выдать неправильную диагностику.

Вы с удивительным упорством защищаете тезис о том, что состояние системы во время бэкапа неважно. Вы действительно так считаете?

myhand:
Можно смело увольнять администратора за криво настроеный "watchdog". Объяснять почему?

Обязательно.

myhand:
Начните с того, что вспомните откуда эти ваши "две минуты" вновь появились.

Мы же суспендим для получения бэкапа, то есть простой будет, вполне вероятно, несколько минут - что превысит таймауты большинства приложений. SSH может и выстоит, если никто не будет им в эти минуты пользоваться, но в общем любое соединение, которое будет передавать или получать - будет разорвано.

---------- Добавлено 20.12.2012 в 12:55 ----------

myhand:
Неправда, не то. И оно *уже* есть.

Да, внимательно прочитав - не то. К бэкапу вообще никаким боком не относится, кстати.

---------- Добавлено 20.12.2012 в 13:11 ----------

netwind:
Понятно, что какие-то сложности всегда возможны, но вы вот время когда-нибудь подводили скачками на типичном сервере хостинга? И что-нибудь рухнуло ? Практически ничего же не происходит.

Простейший пример - если в очереди постфикса лежит письмо, то есть хорошие шансы, что отправитель после восстановления из бэкапа получит сообщение о недоставке. Если что-то типа monit настроено на реакцию на одно пропущенное событие, тоже, я думаю, может что-то не то сделать. Если в какой-то программе есть вычисление среднего за текущий и предыдущий интервал - будет падение показателей. И так далее, всё зависит от того насколько тщательно написана программа. ntpd не на пустом месте возник.

Andreyka:
А еще можно просто сделать локинг в mysql и sync перед саспендом. Потом локинг снять.

Все такие простые... Предположим, для какой-то программы работает watchdog - если она в течении какого-то времени не производит действий, программа перезапускается. Засуспенденный бэкап, после восстановления, такую программу с большой вероятностью перезапустит, несмотря на то что она, возможно, выполняла критическую операцию. Возможно, банальный postfix на прыжок времени отреагирует неправильно, zabbix взвоет. Даже локинг и sync в mysql может вызвать совсем не тот эффект который ожидался (хотя если суспендим VPS с сохранением памяти - чего там лочить казалось бы). Две минуты на суспенд - и соединения отвалятся. Много ещё можно чего вспомнить.

Это всё игнорируется, если альтернатива - полная потеря данных, но не принимать во внимание такие эффекты (точнее закрывать глаза на их существование) нельзя. Горячий бэкап - штука крайне сложная, и ни суспендом, ни снапшотами его сделать полноценно не получится. Базовый алгоритм бэкапа должен быть : все процессы прекращают изменять состояние сервера, бэкап или снапшот, все процессы работают как должны. Вроде просто, а как реализовать? Надо же сотрудничество всех процессов. Только CMS'ы тут подстраховались - у них обычно есть режим обслуживания - именно чтобы защититься от изменения состояния.

Всего: 2890