Вероятность того что сломается один сервер на порядки выше чем вероятность того что одновременно сгорят пол сотни серверов в кластере.
А если своя железка накроется? Что лучше в таком случе, облако или свой сервер?
Rengen, тесты на передачу данных еще раз проводили? Интересно, что у Вас получилось.
По поводу работы... Вакансии есть на сайте в разделе "о компании".
Шина QDR. RDMA теоретически позволяет выполнить то о чем Вы говорите, но практическая реализация займет кучу времени + тестирование. Такая задача у нас скорее в рамках научного исследования числится :) и в продакшене в ближайшее время не появится.
Suse в Dom0, но может быть уйдем от SLES так как патчи долго ждать от них. Выбрали SLES потому, что эта ОС лучше работает с Infiniband, который мы используем для интерконнекта. Но это субъективно. CentOS в DomU потому, что более стабилен с MOD. Хотя тоже только наше мнение. Как раз ядро в DomU и должно поддерживать hotplug.
С linux GPFS тоже работает. Конкретно у нас оаботает на SLES
Проссылку не понял. Ссылку на что? На возможности ядер linux?
Виртуализация: XEN
Файловая система: GPFS
Принцип работы простой. Если говорить об услуге Scale Server (топикстартер именно эту услугу описал), то для виртуального сервера выделяется опреративная память по потребностям ОС. Выделение происходит с помощью встроенной в ОС функциональности hot plug memory. Когда и сколько добавлять или забирать памяти решает контроллер кластера. Для этого контроллер собирает информацию о состоянии виртуального сервера раз в секунду. Кстати, Swap жизенно необходим при больших запросах памяти в промежутке между сбором статистики, мы крнечно оставляем запасом 100МБ свободных, но этого может не хватить при резком росте нагрузки и swap выручает до следующего выделения.
Виртуальному серверу выделяются все доступные ядра физической ноды. При этом гарантируется, что на каждые 256МБ выделенной памяти вы безусловно получите 6,25% мощности одного ядра.
Виртуальный сервер может масштабироваться в рамках физической ноды без дополнительных вмешательств со стороны. Если при масштабировании на ноде есть другие виртуалки, и недостаточно места для масштабирования, мы мигрируем последовательно и в рамках необходимого ресурса на рост маленькие и не загруженные виртуалки. Масштабирование более чем на одну ноду также возможно с помощью балансировщика, но эта услуга предоставляется в индивидуальном порядке. Сейчас, например, мы ведем переговоры по реализации проекта вычислительной инфраструктуры пресс-центра и медиабанка футбольного клуба Зенит (до 250 тыс. хостов и более 2 млн хитов в день). После реализации напишем подробности на хабре.
Это базовые сведения о работе хостинга. Если есть более конкретизированные вопросы, готов ответить на них.
Спасибо. Попробуем диагностировать Вашу ситуацию со свопом
А также в ситуации с ddos и использованными (оплаченными) во время атаки ресурсами, вопрос можно решить индивидуально. В clodo.ru идут на встречу и делают перерасчет с возвратом денег на баланс. Мы же тоже люди, всё понимаем :)
Использование Swap целесообразно. Не надо лишь допускать того что бы он активно юзался. Без swap может получиться out of memory при резком запросе большого объема оперативки. При этом мы (clodo.ru) считаем что swap не должен билинговаться, так как это инструмент, который нам помогает нам давать сервис MOD более стабильно. То что у Вас был отключен Swap диск очень странно, я специально сейчас проверил, создал виртуалку и swap вижу.
У clodo.ru swap на все виртуалки включая масштабируемые 5ГБ. Хотел попросить топикстартера скинуть ID виртуалки в приват.