chil

Рейтинг
1
Регистрация
04.02.2012

Переписка админа и хостера (сокращённая, выдержки):

Начиналось всё так:

Админ:

Seems to be, that hdd is failing -

I have following entries at my syslog:

Feb 1 16:58:18 this_site kernel: [5982273.817998] sd 2:0:0:0: timing out command, waited 1080s

Feb 1 16:58:18 this_site kernel: [5982273.818135] sd 2:0:0:0: [sda] Unhandled error code

Feb 1 16:58:18 this_site kernel: [5982273.818137] sd 2:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_OK

Feb 1 16:58:18 this_site kernel: [5982273.818140] sd 2:0:0:0: [sda] CDB: Write(10): 2a 00 04 c3 13 28 00 00 08 00

Feb 1 16:58:18 this_site kernel: [5982273.818152] end_request: I/O error, dev sda, sector 79893288

Feb 1 16:58:18 this_site kernel: [5982273.818271] Buffer I/O error on device sda6, logical block 613

Feb 1 16:58:18 this_site kernel: [5982273.818374] lost page write due to I/O error on sda6

Feb 1 16:58:20 this_site kernel: [5982275.238805] sd 2:0:0:0: timing out command, waited 1080s

Feb 1 16:58:20 this_site kernel: [5982275.238934] sd 2:0:0:0: [sda] Unhandled error code

Feb 1 16:58:20 this_site kernel: [5982275.238937] sd 2:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_OK

Feb 1 16:58:20 this_site kernel: [5982275.238941] sd 2:0:0:0: [sda] CDB: Write(10): 2a 00 04 c3 00 00 00 00 10 00

Feb 1 16:58:20 this_site kernel: [5982275.238948] end_request: I/O error, dev sda, sector 79888384

Feb 1 16:58:20 this_site kernel: [5982275.239057] Buffer I/O error on device sda6, logical block 0

Feb 1 16:58:20 this_site kernel: [5982275.239156] lost page write due to I/O error on sda6

Feb 1 16:58:20 this_site kernel: [5982275.239163] Buffer I/O error on device sda6, logical block 1

Feb 1 16:58:20 this_site kernel: [5982275.239275] lost page write due to I/O error on sda6

Поддержка:

The errors are caused by our Storage platform which experienced some

problems yesterday and today.

We are solving the problems during the day. Our apologies for the

inconvenience.

If you have any further questions or additional comments, please don't

hesitate to contact us.

---

Your server is being moved now to a different server. When it's done I

will inform you so you can re-check your performance.

---

Your server is already migrated, so you should not have these issues

anymore.

I will now close this ticket.

---

Далее: сервер не стартует, спрашиваем про KVM, грузимся с live cd

всё порушено

---

Админ:

I have investigated, what have left on filesystem after hdd troubles.

Practically all our work is wasted. How could this happen? With RAID 6 ? Is it possibly to recover data, may be for extra money, or it completely lost?

---

Поддержка:

I'm not sure what happened to your VPS but it had some major file system

errors. There's nothing wrong with the RAID config of the underlying

storage system.

It's not possible to recover more data since the live cd is the same

what we can also do. So I'm sorry to inform you that the only option is

to reinstall your VPS if there's nothing left to copy.

---------- Добавлено 06.02.2012 в 14:33 ----------

Финита ля комедия.

Остались вопросы:

1) Не противоречат ли они сами себе? То ли были проблемы с хранилищем, то ли не было.

2) Мог ли админ намеренно или случайно вызвать проблему?

Готовлю план действий по восстановлению всего что было. Надеюсь, за пару недель управлюсь.

Думаю, все уже поняли что это была реклама еженедельных (как минимум) бэкапов на удалённом хранилище.

klamas:

Причем тут raid6?
Если данные повредились, то они повредились. Вам ведь не сказали, что они пропали, от пропажи их "raid-ы защищают"

raid6 при том, что убить его, как я понимаю очень сложно - (ну это я так по-ламерски)

1) не заменить 2 сдохших винта вовремя

2) или контроллер сдох

---------- Добавлено 05.02.2012 в 12:16 ----------

Romka_Kharkov:
klamas, от пропажи защищают не рейды а бекапы регулярные, а рейды лишь дают некую отказоустойчивость при работе с вашими данными, но если это RAID-6, на сколько я помню, это аналог RAID-5(+1) , т.е два винта в избытке, надо бы глянуть сколько там всего винтов, а то там может RAID-6 из 2х винтов :D :D :D

да, я бы тоже хотел взглянуть )) именно на этот сервер. жаль вот только что он в Голландии

"куча файлов без названия" :D которую ваш сисадмин цитировал, это скорее всего содержимое папочки lost+found после креша файловой системы, по идее там файлы все на месте, только вот понять какой как назывался и где располагался - будет весьма не просто, точнее рутинная работа и не всегда приводящая к позитивному результату.

морально готовлю себя к тому чтобы рыться в этой куче... 😒

А вы уже исключили например вариант, что ваш админ криворук и сломал вам сервер, а хостер вообще ничего не знает про это ... ?:) Чисто интересно :D К появлению такой папочки с кучей файликов может спокойно быть причастен именно админ который например "fsck -y" запустил в надежде "все починить" :D

Нет, не исключаю. Почитал про команду... Да, выглядит вполне правдоподобно... Так прямо и хочется с параметром -y запустить

klamas:
Не ваша а нанятого админа, почему он не сделал резервное копирование при оплаченной первоначальной настройке?

моя потому что Я должен был уточнить и проконтролировать

coretek_ru:
а что мешает делать бэкапы своевременно, на автомате ?
что делать - понятно, заново все делать теперь

Вина 99% моя, что бэкап не был настроен.

Если заявлен Raid 6, каковы шансы на восстановление? Как уговорить хостера заняться восстановлением? Сколько это может стоить?

То есть вопросы непосредственно к хостерам, если такие небожители согласятся ответитть простому глупому смертному )