Проблемы с двумя новыми серверами SoYouStart.com (OVH)

G
На сайте с 31.08.2010
Offline
24
2692

Здравствуйте!

Вообщем история такова. Заказал я два новых сервера на soyoustart за 40,99 евро (Intel Xeon E3 3.4 ghz).

Понравилась оперативность выдачи серверов.

На один сервер перенес сайт своего проекта. На другой сервер - перенес сервер популярной игры.

До этого сайт и сервер работали на двух серверах конкурентной для вас компании. Сервера были чуть слабее, процессор i7 (2.6 ghz). На старом хостинге работало все идеально примерно 1,5-2 года. Перешел, потому что у вас сервера поновее и помощнее.

И вот что я начал наблюдать на новом хостинге. На двух новых серверах периодически (точного графика нету, бывает раз в день, бывает 3 раза в день) начались непонятные перезагрузки/падения. На сервере с сайтом процессор, диск, память практически не нагружены. И там тоже происходит аналогичное.

Естественно полез в /var/log и ничего конкретного об этих перезагрузках ненашел.

Когда сервер падает то на почту приходит такое письмо :

Our monitoring system, has just detected a defect on your server ns3356385.ip-37-59-31.eu (ns3356385.ip-37-59-31.eu). This defect was noted at 2013-12-08 10:29:57

Our technicians, who work 24 hours a day, have also received this alert. However, they may be conducting another intervention and we are unable to give you a precise time.

You will be informed at the beginning of the intervention by email.

While waiting for the intervention of our teams, you always have the possibility
of hardware reboot in the manager.

Logs:
----------------------
PING ns3356385.ip-37-*-*.eu (37.59.*.*) from 213.186.33.13 : 56(84) bytes of data.
From 213.186.33.13: Destination Host Unreachable
From 213.186.33.13: Destination Host Unreachable
From 213.186.33.13: Destination Host Unreachable
From 213.186.33.13: Destination Host Unreachable
From 213.186.33.13: Destination Host Unreachable
From 213.186.33.13: Destination Host Unreachable

Сам сервер подымается минут через 40, иногда приходилось просто перезагружать его через Hardware Reset, чтобы он поднялся.

Напомню, что вся конфигурации, все настройки полностью переехали с другого хостинга. Операционка стоит CentOS 6.5 х64. Так происходит на двух серверах soyoustart.

Клиентов перевел обратно на старый хостинг. Что делать дальше, незнаю. Не первый год занимаюсь администрированием CentOS, но такого не встречал. Не могут же два дефектных сервера попасть ко мне одновременно? У кого-то еще возникали такие проблемы как у меня?

Кто может подсказать, как же глянуть, из-за чего эти падения происходят?

Оригинал темы http://forum.ovh.lt/showthread.php?984-%D0%9F%D1%80%D0%BE%D0%B1%D0%BB%D0%B5%D0%BC%D1%8B-%D1%81-%D0%B4%D0%B2%D1%83%D0%BC%D1%8F-%D0%BD%D0%BE%D0%B2%D1%8B%D0%BC%D0%B8-%D1%81%D0%B5%D1%80%D0%B2%D0%B5%D1%80%D0%B0%D0%BC%D0%B8-SoYouStart

N
На сайте с 06.05.2007
Offline
419
#1

Теоретически, на таком железе может нормально работать machine check exception и возможно что-то удастся выудить с помощью программы mcelog после каждого такого зависания.

Практически, я почти никогда не видел чтобы она работала нормально. Не расшифровываются эти записи нормально.

KVM еще подключите. Если проблема не связана с железом, а например перегрузкой сервера, то на KVM вы возможно увидите какие-нибудь "предсмертные судороги" .

Не первый год занимаюсь администрированием CentOS, но такого не встречал.

ну хотя бы могли бы уже усвоить, что в CentOS все устаревает еще до выхода очередной версии. Не пробовали ради эксперимента fedora или ubuntu ?

проблемы с драйверами на новом железе - это очень типично для centos.

Кнопка вызова админа ()
Mik Foxi
На сайте с 02.03.2011
Offline
1076
#2
goodie:
Напомню, что вся конфигурации, все настройки полностью переехали с другого хостинга.

конфликты и проблемы с драйверами могут быть.

Антибот, антиспам, веб файрвол, защита от накрутки поведенческих: https://antibot.cloud/ + партнерка, до 40$ с продажи.
Goldsnich
На сайте с 17.07.2011
Offline
52
#3

ТС, на вашем месте попросила бы KVM, это уже если совсем ничего не видно в dmesg, kernel.log, messages, syslog.

А вообще ситуация странная, тоже любопытно с чем это может быть связано на абсолютно новом железе.

Покупаю сайты с доходом sape и др. (http://goldsnich.com/sell/)
G
На сайте с 31.08.2010
Offline
24
#4
Goldsnich:
ТС, на вашем месте попросила бы KVM, это уже если совсем ничего не видно в dmesg, kernel.log, messages, syslog.
А вообще ситуация странная, тоже любопытно с чем это может быть связано на абсолютно новом железе.

soyoustart не поддерживает kvm http://www.soyoustart.com/offres/sys-e32-3.xml, в отличие от серверов подороже на ovh.com.

Andreyka
На сайте с 19.02.2005
Offline
822
#5

Скорее всего в bios включена опция green tech - вырубить нахрен :)

Не стоит плодить сущности без необходимости
P
На сайте с 08.03.2007
Offline
250
#6

Единственное что мне приходит на ум - проблемы с дисками, если сервер действительно через 40 минут сам восстанавливается. Поставьте zabbix на оба сервера и помониторьте друг друга.

G
На сайте с 31.08.2010
Offline
24
#7

Итак, спустя 10 дней теста на двух серверах наконец-то могу с уверенностью сказать - проблема устранена, внезапных перезагрузок не было.

Спасибо уважаемому rootden за совет по снижению частоты процессора. Выполнил всего лишь две команды и сервера больше не падают:


yum install cpufrequtils
cpufreq-set -c 0 --max 3400000

Напоминаю, что такие краши системы только на процессорах http://www.soyoustart.com/offres/sys-e32-3.xml

На остальных не проверял. Подозреваю что на i7 таких проблем не будет (ибо работало 1,5 года на стороннем хостинге без понижения частоты).

Всем спасибо за помощь и советы!

N
На сайте с 06.05.2007
Offline
419
#8
goodie:
Спасибо уважаемому rootden за совет по снижению частоты процессора. Выполнил всего лишь две команды и сервера больше не падают:

а вы понимаете, что когда придет нагрузка, частота автоматически повысится и они начнут падать ?

seocore
На сайте с 25.09.2006
Offline
143
#9
netwind:
а вы понимаете, что когда придет нагрузка, частота автоматически повысится и они начнут падать ?

например, на некоторых материнках ASUS (а их любят использовать в "десктопных" бюджетных серверах) по-умолчанию бывает установлена опция авто-оверклокинга (и частота может улететь на некоторых ядрах под 4.4-4.5ГГц, а это не штатный/безопасный TurboBoost - это нечто другое), а софтовое понижение частоты до 3400 (нормы) вполне себе решит проблему

как писал Andreyka, на серверных конфигурациях стоит отключать всякие "зеленые" ECU, авто-разгонялки и прочие улучшайзеры прямо в BIOS'е - значительно повысит стабильность :)

Инструменты для веб-мастера: кластеризатор СЯ (https://goo.gl/MQWfqO), все запросы конкурента (https://goo.gl/hd5uHS), дешевые XML-лимиты (https://goo.gl/aDZbPI)
G
На сайте с 31.08.2010
Offline
24
#10
netwind:
а вы понимаете, что когда придет нагрузка, частота автоматически повысится и они начнут падать ?

нагрузка не спадает уже 10 дней, все ядра используются на 80%.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий