UNIT-IS

UNIT-IS
Рейтинг
48
Регистрация
19.10.2012
Интересы
интернет, технологии, серверы, "железо", сайты, хостинг

Мишо, увы, это непредсказуемо.

На текущий момент мы зафильтровали часть вредоносного трафика, что позволило разгрузить серверную часть кластера и обеспечить доступность максимального числа ресурсов.

Спасибо. Рассматриваем и такой вариант.

Приносим извинения, но консультации по телефону сейчас оказываются только в дневное время до 20 часов по Киеву.

Что касается доступности сайтов, ждем пока спадет атака. Залетает порядка миллиона пакетов в секунду. Специалисты дата-центра параллельно занимаются поиском решения по предотвращению подобных ситуаций в будущем.

По причине DDoS атаки часть веб-ресурсов, расположенных на кластерном веб-хостинге испытывают временные перебои с доступностью. Системные администраторы дата-центра работают над устранением последствий атаки. Сегменты виртуальных и выделенных серверов, а также оборудование, находящееся на колокации данных перебоев не испытывает.

Администрация приносит извинения за временные неудобства клиентам, чьи сайты оказались недоступны.

KWIN:
Напишите, пожалуйста, поподробнее про пункт

опишите или на примерах расскажите, какие услуги может оказать администратор

5 часов администрирования - это минимальное оплачиваемое время, за решение практически любой задачи по установке и настройке сервисов на Вашем сервере.

Это может быть настройка apache2, или настройка почты, или перенос базы данных и сайта с Вашего домашнего компьютера или предыдущего хостинга и т.п.

Если будет поставлена объёмная задача, которая явно займет более пяти часов администрирования, то будет сниматься дополнительная плата за следующие 5 часов администрирования (предварительно будет согласовываться).

Уважаемые пользователи, публикуем краткий отчет о технической проблеме, возникшей на кластерном хостинге 21 октября в 23:40 по киевскому времени.

После предоставления индивидуального IP одному из клиентов виртуального хостинга, панель ISPmanager перезапустила конфигурацию веб-сервера Apache2 на одном из серверов кластера. Ввиду программной ошибки ISPmanager, запросивший IP пользователь имел пустой конфигурационный файл, из-за чего Apache2 автоматически не возобновил свою работу и, как следствие, все сайты виртуального хостинга стали недоступными. Ручной запуск Apache2 не увенчался успехом из-за зависших дочерних процессов, вследствие чего, дежурным администратором было принято решение перезагрузить сервер.

Как выяснилось впоследствии перезагрузки, на сервере был некорректно настроено монтирование NFS (Network File System) рабочего каталога клиентских данных с главного хранилища.

Конфигурация монтирования не была корректно настроена на версию NFS4, которая предполагает размещения всех сообщаемых нод в один домен. В результате этого трансляция прав на содержимое монтируемого каталога рабочей среды устанавливалась на анонимные nouser:nogroup и запуск сервисов был невозможен. Ввиду того, что настройку сервера для работы по NFS производил не по инструкции администратор, в настоящее время уже не работающий в дата-центре, данный параграф можно отнести исключительно к человеческому фактору.

Далее, дежурный администратор произвел конфигурирование сетевого доступа согласно официальной документации по настройке NFS. Были отредактированы следующие конфигурационные файлы:

* /etc/hostname (корректно указаны имена хостов);

* /etc/hosts (добавлены описания всех хостов в кластере);

* /etc/resolv.conf (указаны домен, в котором состоит кластер);

* /etc/idmapd.conf (указан домен, к которому принадлежат пользователи и группы, которым были назначены права).

Переустановлен rpcbind, очищены конфликтирующие упоминания о portmap. Службы nfs-kernel-server nfs-common были перезапущены и только после этого права на файлы и каталоги восстановились. Аналогичные проблемы на других нодах исправляли тем же способом. Выявленные проблемы с запуском Apache2 имели причину того, что по умолчанию Apache2 запускался вне chroot рабочего каталога.

Полная работа кластерной системы была восстановлена в 21:00. Время простоя составило 21 час 40 минут.

Большая часть времени была затрачена именно на трассировку неисправностей нежели на их исправление.

Старший администратор ЦОД Виктор Савченко, на смене которого произошла проблема, считает, что пустой конфигурационный файл клиента, из-за которого все и началось, возник в результате сбоя работы системы ISPManager Cluster, а также неустойчивой конфигурации самого кластерного хостинга, что и привело к неработоспособности всех сервисов после рестарта одного из серверов. Проблема требует дополнительного изучения и ручной очистки упоминаний об отсутствующем в панели виртуального пользователя из всех конфигурационных файлов связки Nginx, Apache2 и ISPManager.

В дополнение, сообщаем о завершении реконструкции независимой системы бэкапирования на кластерном хостинге. Перечень доступных архивов бэкапов клиенты уже могут увидеть в панели управления в разделе резервных копий. Подробнее об устройстве независимой системы бэкапирования будет указано позднее.

Администрация дата-центра приносит извинения своим клиентам, ресурсы которых оказались недоступны в момент аварии. Напоминаем о целесообразности переноса чувствительных к простоям важных корпоративных и бизнес-ресурсов на выделенные серверные мощности, что обеспечит индивидуальный серверный ресурс, большую производительность, а также гарантию бесперебойности и автономности работы ресурсов.

В качестве компенсации за простой сервера, администрация дата-центра предоставит 1 месяц бесплатного пользования сервисом согласно действующего тарифного плана и 5 часов администрирования ресурсов единоразово каждому клиенту, активированному на момент аварии.

Для получения возмещения необходимо обратиться в службу абонентской поддержки дата-центра ЮНИТ-ИС через тикетную систему с соответствующим запросом по компенсации в период с 24 по 31 октября 2013 года, по получению бесплатного администрирования с 1 ноября по 30 ноября 2013 года.

Белый Ум, к сожалению приходим к тому же мнению. Программное обеспечение ISPsystem работает крайне нестабильно и подводит уже не первый раз. Специалисты дата-центра работают над проблемой с ночи. Обещают восстановление всех сервисов кластера в течение часа.

Amigo_9876, не получается активировать тест? Обратитесь, пожалуйста, с тикетом в службу поддержки.

Skrappy, Монитор Клавиатурович, большое спасибо за отзывы!

masterlan, да, конечно.

Мало ли, что на наклейке будет написано...

masterlan:
Простите, вопрос.

Вы замеряете реальное потребление сервера, или смотрите по наклейке БП? скажем если БП 250W, реальное потребление 70-90W, за что нужно будет платить?

Каждый сервер включается в управляемую розетку электропитания, которая позволяет мониторить сиюминутную электрическую нагрузку. Дополнительная оплата взимается при превышении фактических 100W на сервер, а не заявленных производителем БП. По нашему опыту, реальное энергопотребление типового сервера не превышает 100W. Большее энергопотребление имеют блейдовые системы, дата-банки, а также устаревшее аппаратное обеспечение (до 2005 года).

Всего: 352