Что это было с форумом

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
7630

Постараюсь объяснить, что происходило такое с форумом, что заняло так много времени на восстановление. Тем более, что сами уже вроде разобрались.

Форум со всеми дополнительными сервисами вообще размещен на нескольких серверах, но с недавнего времени (с февраля) его основная часть - база и основные скрипты - размещена на одном сервере. Вечером в субботу, 22 августа, у него начал сбоить жесткий диск. Сначала ошибок было немного, постепенно в течение воскресенья, ситуация развилась. В итоге после перезагрузки диск стал мигать и сообщать о фатальных ошибках RAID.

Здесь у нас возникла путаница, поскольку изначально диск был сконфигурирован как RAID - поэтому первоначально казалось, что достаточно заменить диск или просто разобрать массив и все будет работать. Оказалось, что рейда фактически не было, был один диск, включенный в контроллер.

Соответственно, мы начали пытаться вытащить информацию с диска.

Лучше бы мы этого не делали - диск все же оказался серьезно битым, ничего из того, на что не было бэкапов, так и не вытащили. Только время потеряли. А, учитывая, что диск был сильно битым, скорость "вытаскивания" информации была никакой и эта операция заняла почти сутки.

В итоге вчера днем мы получили от датацентра сервер с начисто, уже на RAID1, установленной системой и начали конфигурировать его. Учитывая, что Lupus это делал через GPRS, скорость конфигурации стоит признать рекордной :).

Все было бы сделано быстрее, если бы не особенности работы датацентра. Если точнее - сервиса collocation компании "Петерхост". Эта компания не имеет собственного датацентра, серверы размещаются в ДЦ "Стек". Хуже того - поддержка collocation работает исключительно в рабочее время - с 10 до 19 МСК. Поэтому первый человек подошел к серверу днем в понедельник - пока на работу пришел, пока до датацентра доехал и так далее.

У меня, в-общем, нет в данном случае особых претензий к "Петерхосту" - хорошая компания, очень гибкий выбор серверов, но вот, если что-то сломается, скоростной починки может не случиться. И на админов техподдержки лучше особо не надеяться. Видимо, поэтому подключение IPMI - штатная услуга при заказе сервера :).

Сервер восстановлен из бэкапов от 22 августа, так что часть информации все же пострадала.

Поскольку сервер поднимался в авральном порядке, возможны некоторые глюки. Потерпите, пожалуйста - со временем всё донастроим и доведем до ума.

[Удален]
#1
...установленной системой и начали конфигурировать его. Учитывая, что Lupus это делал через GPRS, скорость конфигурации стоит признать рекордной

Lupus`у и всем админам респект

Alex91
На сайте с 30.12.2007
Offline
258
#2

Gray, если здесь писать о недочетах - висит личное сообщение "новое 1", но его нет

C Уважением, Алексей
Web-Silver
На сайте с 02.05.2007
Offline
256
#3

Gray, спасибо за информацию. Если позволите, укажу на некоторый глюк, после восстановления, вверху висит:

Личные сообщения: новых 1

при этом, в панели управления этого нового сообщения нет. До всего случившегося, приходило уведомление о новом сообщении, видимо, как накатите базу последнюю, оно появится?

moldu
На сайте с 27.04.2006
Offline
432
#4

Gray, Сергей, а можно в следующий раз :D комменты не закрывать?

Ну и Александр как всегда доказал, что он мегаадмин 🍻

Глаза боятся, а руки-крюки.
-S
На сайте с 10.12.2006
Offline
1354
#5
Web-Silver:
Личные сообщения: новых 1

Проверьте все сообщения, возможно, есть 1 непрочитанное. Было уже такое в свое время, активировались старые непрочитанные.

TheGRAM
На сайте с 23.07.2008
Offline
133
#6
Lupus`у и всем админам респект

+1

......................

1. Тиц 10 за 12$ - работает! (/ru/forum/250674) ICQ:364-244-059 (регистрация в каталогах .ru, .com, .de и др.стран). В каталогах статей англоязычных. 2. Куплю сайты (/ru/forum/541017) с pR: дорого! {=- тиц не нужен! -=} | IT - Мысли (http://www.it-thoughts.ru)
vedomir
На сайте с 01.07.2004
Offline
167
#7

ДЦ Стек , это видимо тот самый, который в Москве на Войковской. Из которого я свалил, когда высыпался диск, но рейд тогда все-таки воскресили часов за 5.

ostmaster
На сайте с 01.09.2002
Offline
222
#8

Небольшое уточнение для рекламодателей.

Простой будет компенсирован в двойном объеме, подробнее отпишу завтра в соответствующей теме.


Убедительная просьба ко всем.

Потерпите день-другой сообщать о недочетах, да они есть и какое-то время будут, ведь работы еще ведутся.


Тестирование мобильных приложений и сайтов (/ru/forum/1032925) https://www.facebook.com/ostmaster (https://www.facebook.com/ostmaster)
Zikam.RU
На сайте с 15.03.2006
Offline
260
#9

Ну и хвала Аллаху, что все починилось. А то у меня уже F5 начала плесенью зарастать :)

полиуретановые формы для литья гипса, бетона и чего угодно (https://vk.com/zikam) декоративный камень из гибкого бетона (https://vk.com/elasticstone)
Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#10
vedomir:
Из которого я свалил, когда высыпался диск, но рейд тогда все-таки воскресили часов за 5.

Если бы у нас RAID не был сконфигурирован на одном диске... :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий