Хостер убил данные, нужен совет

1 234
Raistlin
На сайте с 01.02.2010
Offline
247
#21
bugsmoran:
Кто-то явно прикрывает другой косяк под предлогом "сбой файловой системы".

Гм. Например, некоторые панели создают виртуалки с ext2. Я наблюдал почти полную потерю данных на ВМ Debian, при том, что ДО перезагрузки виртуалка работала как-то криво. А после перезагрузки отказалась грузиться. FSCK потом сказал, что перепутались файловые дескрипторы. После этого - слепок диска, накат новой системы, потом ручками восстановление файлов из слепка. Почти всё дерево ФС в lost+found после краха и проверки. Так что могло быть. Но в остальном - вполне вероятно, что рейда на ноде небыло, или куча факторов, вплоть до удаления админом по ошибке.

HostAce - Асы в своем деле (http://hostace.ru)
bugsmoran
На сайте с 18.02.2010
Offline
223
#22
Raistlin:
Но в остальном - вполне вероятно, что рейда на ноде небыло

Я как раз подчеркиваю, что не было проблемы рейда, а не самого рейда. Есть такие варианты событий:

1) Рейда нет. Диск сгорел. - тогда бы вообще ничего не увидели, но ведь нам известно, что система еще бултыхалась.

2) Рейд есть. Сгорело дисков больше, чем требуется для работоспособности. - тогда бы вообще ничего не увидели, но ведь нам известно, система еще бултыхалась.

3) Рейд есть. Сгорело дисков меньше, чем требуется для работоспособности. - тогда бы вообще ничего не заметили. Система бы продолжила работать в штатном режиме.

4) Рейд есть. Ничего не сгорало. - тогда бы вообще ничего не заметили. Система бы продолжила работать в штатном режиме.

А значит нету сценариев, которые вообще хоть как-то приводят к вопросу а был ли рейд. Неважно был он или нет в данном инциденте.

Mik Foxi
На сайте с 02.03.2011
Offline
1076
#23

bugsmoran, был случай, raid1, один диск сдох, сервер начал "частично" работать, т.е. одни сервисы и программы работали, другие не хотели, после перезагрузки сервера сдохло все, полетела файловая система, данные восстанавливали долго потом, сами, получив диски почтой, хостер же скорее всего не будет заморачиваться с таким восстановлением...

Антибот, антиспам, веб файрвол, защита от накрутки поведенческих: https://antibot.cloud/ + партнерка, до 40$ с продажи.
Raistlin
На сайте с 01.02.2010
Offline
247
#24

bugsmoran, Ещё рассказываю. Из недавнего. Посыпались сектора на обоих дисках в RAID1. Мне было оооочень весело. При том, что mdadm если не может считать данные со старого диска (сбойного) - начинает операцию сначала. И никаких гвоздей. Сколько нервов стоило сделать на этих самуснгах ремап (они отремаились, но вот на смарте не отобразилось это дело - электроника больно хитрая) - я вообще молчу. Хорошо - 8 Мбайт данных улетело... Просто ФС проверил и вроде как порядок. А вот если бы эти 8 Мбайт были в другом месте.... :). Я говорю о том, что касяк мог быть вообще форс-мажорный, а объяснили "чтобы клиент понял".

[Удален]
#25
bugsmoran:

2) Рейд есть. Сгорело дисков больше, чем требуется для работоспособности. - тогда бы вообще ничего не увидели, но ведь нам известно, система еще бултыхалась.
3) Рейд есть. Сгорело дисков меньше, чем требуется для работоспособности. - тогда бы вообще ничего не заметили. Система бы продолжила работать в штатном режиме.
4) Рейд есть. Ничего не сгорало. - тогда бы вообще ничего не заметили. Система бы продолжила работать в штатном режиме.

Это только в теории так, на практике все может быть совсем по-другому:)

И система может бултыхаться на полу-живых дисков и т.д. Кстати диски не обязательно "горят", на них может тупить SMART, может тупить контроллер Рейда, может еще что-то тупить, в общем в теории Вы правы, а на практике эта теория работает в 50% случаев, ибо не учитывается множество факторов.

Вот Вам цитата:

RAID массив не является панацеей от потери информации. Практика показывает, что случаются как сбои в работе контроллера, так и сбои в работе жестких дисков, или же происходит одно вытекающее из другого. В любом случае, полностью полагаясь на надёжность массивов и не позаботившись о своевременном создании резервных копий, Вы рискуете однажды остаться без «надежно хранимой» информации.

Рекомендую ознакомится с полной версией если интересно http://rlab.ru/doc/raid_recovery.html

Romka_Kharkov
На сайте с 08.04.2009
Offline
485
#26
klamas:

рейд6 из 2х винтов не собирается, надо бы знать ;)

Слово "сарказм" вам знакомо ? :D

---------- Post added 06-02-2012 at 08:10 ----------

Raistlin:
Это может быть деградированный массив. Например, RAID 1 можно собрать на одном диске, когда заказал сервер в аренду и хостер говорит, что вот "с одним диском в течении часа, а с двумя дисками это не стандартная конфигурация и будет ставиться три дня". Тогда берём с одним диском и дозаказываем второй. Когда диск подключат - просто добавляем второй диск в массив. И это нормально. Так же и с остальными уровнями. так что про "крюки" это через чур, существуют ситуации, когда это действительно надо.

Не ну штатными средствами точно не выйдет не 5 ни 6 собрать при использовании 1го диска, рейд-биос не даст такой настройки сделать. Если это конечно не софт-рейд6

---------- Post added 06-02-2012 at 08:13 ----------

Raistlin:
Гм. Например, некоторые панели создают виртуалки с ext2. Я наблюдал почти полную потерю данных на ВМ Debian, при том, что ДО перезагрузки виртуалка работала как-то криво. А после перезагрузки отказалась грузиться. FSCK потом сказал, что перепутались файловые дескрипторы. После этого - слепок диска, накат новой системы, потом ручками восстановление файлов из слепка. Почти всё дерево ФС в lost+found после краха и проверки. Так что могло быть. Но в остальном - вполне вероятно, что рейда на ноде небыло, или куча факторов, вплоть до удаления админом по ошибке.

ага, выгребал похожее только на физ. сервере с фрей.

---------- Post added 06-02-2012 at 08:16 ----------

bugsmoran:
Я как раз подчеркиваю, что не было проблемы рейда, а не самого рейда. Есть такие варианты событий:
1) Рейда нет. Диск сгорел. - тогда бы вообще ничего не увидели, но ведь нам известно, что система еще бултыхалась.
2) Рейд есть. Сгорело дисков больше, чем требуется для работоспособности. - тогда бы вообще ничего не увидели, но ведь нам известно, система еще бултыхалась.
3) Рейд есть. Сгорело дисков меньше, чем требуется для работоспособности. - тогда бы вообще ничего не заметили. Система бы продолжила работать в штатном режиме.
4) Рейд есть. Ничего не сгорало. - тогда бы вообще ничего не заметили. Система бы продолжила работать в штатном режиме.

А значит нету сценариев, которые вообще хоть как-то приводят к вопросу а был ли рейд. Неважно был он или нет в данном инциденте.

Прости, но если уж совсем внимательно почитать, там пишут про Raid-6, я могу предположить что например в масиве был мертв уже 1 винт, согласен, система должна жить - это нормально, но как жить ? А если это нода.... на сколько я помню когда в RAID5 выпадает 1 винт, данные на месте но производительность падает в разы.... если не в десятки разов.... а если мы говорим о ВПС ноде которые и так обычно в i/o упираются..... могло быть в принципе что угодно ...... Но это конечно ни коему образом не провоцирует появление lost+found..... А вот непроходимость-почты или проблемы с Mysql при сломанном рейде + нагруженной ноде вполне могут произойти как я считаю. Вы же не знаете кто там и как диагностировал изначальные проблемы :D

---------- Post added 06-02-2012 at 08:19 ----------

foxi:
bugsmoran, был случай, raid1, один диск сдох, сервер начал "частично" работать, т.е. одни сервисы и программы работали, другие не хотели, после перезагрузки сервера сдохло все, полетела файловая система, данные восстанавливали долго потом, сами, получив диски почтой, хостер же скорее всего не будет заморачиваться с таким восстановлением...

Это бред..... поймите, какой же смысл в Raid-1 если у вас умер в зеркале винт и накрылось все медным тазом.... либо контролер у вас "супер-дорогой" был , баксов за 8.... или кто-то не верно диагностировал поломку рейда и принял меры которые не стоило бы... У меня почти все железо на raid1 , raid5, raid6, raid10, так вот с первым как правило вообще вопросов нет, там где hotswap винты даже в консоль иногда не захожу, винт вставил новый , лампа заорала на корпусе , ребилд пошел.... только сигнализаторы потом написали что все ок - массив Optimal.

Но если рассматривать случай, то у меня тоже был 1 в моей практике, когда горе-админ удаленно не проверил s\n винтов которые менять надо, а техник на площадке поменял не тот винт, в итоге при Raid-1 мой админ остался с тремя винтами без данных в руках :D Но простите причем тут raid-1 ?:)

---------- Post added 06-02-2012 at 08:25 ----------

mikmik:

Рекомендую ознакомится с полной версией если интересно http://rlab.ru/doc/raid_recovery.html

Панацеи нет ни где, это объективно понятно, я скажу вам что у меня стоит например сервер в котором 16 винтов по терабайту, и там около 90% disk usage уже...... Собрано это все дело в Raid-5 на карточке которая стоит около 800$.... ну и работает это все около 5 лет уже, с периодической заменой винтов которым приходит время..... как видите, регулярная замена винтов, а так же мониторинг их состояния дает вполне не плохой результат, около 5 лет работы..... это не панацея и завтра у меня может в одну секунду 3 винта крякнуть и буду я у разбитого корыта рыдать..... На этот случай у меня стоит рядом точно такой же сервер..... но простите все ли могут себе это позволить ? Да и как собственно иначе вы будете бекапить около 13 TRB данных? и куда? Конечно если ваш сайт весит 100 метров и вы не пользуетесь бекапами - ваше личное дело, но иногда весьма сложно заниматься бекапами огромных объемов данных.... и практически не возможно... по этому вот уже лет 5 рейд есть в некоторым смысле панацеей для меня лично.

Есть около 15.000 ipv4 !!! (http://onyx.net.ua/price.php#ipv4) Качественный хостинг с 2005 года - лучшее клиентам! (http://onyx.net.ua/)
bugsmoran
На сайте с 18.02.2010
Offline
223
#27
Romka_Kharkov:
но если уж совсем внимательно почитать, там пишут про Raid-6, я могу предположить что например в масиве был мертв уже 1 винт, согласен, система должна жить - это нормально, но как жить ? А если это нода.... на сколько я помню когда в RAID5 выпадает 1 винт, данные на месте но производительность падает в разы.... если не в десятки разов.... а если мы говорим о ВПС ноде которые и так обычно в i/o упираются..... могло быть в принципе что угодно ...... Но это конечно ни коему образом не провоцирует появление lost+found..... А вот непроходимость-почты или проблемы с Mysql при сломанном рейде + нагруженной ноде вполне могут произойти как я считаю. Вы же не знаете кто там и как диагностировал изначальные проблемы :D

По поводу дополнительной нагрузки - тут согласен. Даже 1-й рейд будет читать вдвое медленнее (он же пишет на оба синхронно, а читает как с 0-го). Но разве может из-за этого почта "глючить"? Даже предсатвить не могу что должно так тормозить на дисках, чтобы почта стала ходить не как надо.

Romka_Kharkov
На сайте с 08.04.2009
Offline
485
#28
bugsmoran:
По поводу дополнительной нагрузки - тут согласен. Даже 1-й рейд будет читать вдвое медленнее (он же пишет на оба синхронно, а читает как с 0-го). Но разве может из-за этого почта "глючить"? Даже предсатвить не могу что должно так тормозить на дисках, чтобы почта стала ходить не как надо.

Если бы написали не работала почта потому что ..... было бы одно дело.... а то там формулировка в первом посте .... на половину ящиков ходит на половину нет... в моих пониманиях почта всегда по домену ходила , а не по акаунтам... в том смысле, что если MX прописан, то она придет на сервер... а дальше уже....... Там может например написано "нет места на диске", а админ сформулировал как "половина ходит, половина нет..." :D :D :D Так что не получится узнать я думаю.... Ну а когда I/o в сраце.... может и не только почта не ходить :D :D :D

A0
На сайте с 22.03.2009
Offline
229
#29
Demotix:
alex063, а можно просто поинтересоваться... Вот Вы каждый день ручками делаете бэкапы всех своих сайтов на домашний комп? Только честно :)

Еженедельный бэкап делается автоматом. Его и скачиваю (базы внутри). Или при глобальных изменений чего-то по возможности сразу бэкапю. Затраты по времени - минимальны, но не раз помогало сэкономить время.

А на хостера наедятся, если он даже обещает что-то хранить, бэкапить и заливать потом - не буду.

Продвижение и поддержка сайтов. Актуальное конкурентное портфолио. ICQ - 407354474.
Himiko
На сайте с 28.08.2008
Offline
560
#30

Ерунду какую-то пишете по поводу "не могло быть ошибки ФС", не могло из-за одного диска всё сломаться и т.п.

Я видел, когда RAID из 8-ми дисков разваливался на раз и из-за сбоя контроллер затирал информацию. Восстановить, в принципе, реально. Но большой геморрой. Тут и диски целые полностью и железо. Сбойнул контроллер и всё тут, приехали.

Если бы написали не работала почта потому что ..... было бы одно дело.... а то там формулировка в первом посте .... на половину ящиков ходит на половину нет... в моих пониманиях почта всегда по домену ходила , а не по акаунтам.

Да всякое бывает. Удалена папка с диска, вот и "не ходит" почта на конкретный ящик. Получить её сервер не может.

Еще раз перечитайте свои слова. Ничего не замечаете? Вас развели как ребенка!

Во как. Я понимаю, что здесь много телепатов. Но для таких заявлений этого мало и нужны хоть какие-то доказательства.

Кто вам вообще сказал, что почта не ходила на часть ящиков из-за этой проблемы? С чего это стало фактом? Проблемы всякие с почтой бывают.

С чего вы решили, что ФС не может побиться при RAID'е ? Да запросто, как и на одном диске. И на ext3 тоже.

Как можно делать выводы "вас развели" на основе кусочных данных от одного человека, который ещё и приводит отдельные слова остальных? Причём слова хостера мы знаем от админа, а слова админа через ТС.

Никто ничего не знает, но легко обвиняем хостера в разводе клиента.

Профессиональное администрирование серверов (https://systemintegra.ru). Круглосуточно. Отзывы (/ru/forum/834230) Лицензии (http://clck.ru/Qhf5) ISPManager,VDSManager,Billmanager e.t.c. по низким ценам.
1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий