Infobox — печальный опыт

12
K
На сайте с 18.11.2008
Offline
153
2543

Проснувшись утром я как всегда стал проверять биржи ссылок, где я зарабатываю на своих сайтах. Уже более 5 лет я использую хостинг Infobox и уже не удивляюсь когда некоторые сайты зачастую бывают недоступны. Но ситуация возникшая вчера повергла меня в шок. Все сайты недоступны! Казалось бы такое часто бывает, проблема решается как правило за 1-2-3 часа. В этот раз в панели управления висело следущее объявление:

2012-07-30 11:14:20 MSK - Дело в том, что сегодня, 30.07.2012 с 10:30 (MSK), проводятся внеплановые работы на сервере в связи с перебоем в работе RAID-массива. Во время работ возможна временная, до 60 минут, недоступность сервера. По этой причине возможно были недоступны некоторые элементы Ваших ресурсов, вследствие чего наблюдались ошибки. На данный момент работы все еще ведутся и ресурсы недоступны полностью. Мы будем информировать Вас о ходе работ с помощью новостей в панель управления support.infobox.ru. Приносим извинения за возможные неудобства.

Далее я буду цитировать переписку с техподдержкой

Я(2012-07-30 20:23:54 MSK): Сайты недоступны весь день, сколько еще это будет продолжаться? Это позор для такой крупной хостинг компании!

ТП(2012-07-30 20:46:06 MSK): К сожалению, работы продлились весь день и еще не закончены. Это физическая неполадка, которая могла случиться с сервером совершенно любой хостинг-компании, и ее устранение занимает время. Надеемся на Ваше понимание.

Я(2012-07-31 00:39:31 MSK): Обещали устранить проблему к 0.00, сайты до сих пор недоступны!!!

ТП(2012-07-31 01:03:41 MSK): Работы, к сожалению, потребовали намного больше времени, чем прогнозировалось изначально. На данный момент продолжается процесс копирования файлов пользователей, который завершен на 50%. Ориентировочное время окончания работ — 31.07.2012 в 08:00 (MSK). Будем информировать Вас о ходе работ, информация будет доступна в виде новости в панели управления аккаунтом (support.infobox.ru). Приносим свои извинения за возможные неудобства.

Я(2012-07-31 08:41:12 MSK): Работы по восстановлению полностью завершены?

ТП(2012-07-31 08:46:15 MSK): На данный момент производится корректировка данных владельцев и проверка работоспособности. Ориентировочное время окончания работ — 31.07.2012 в 10:00 (MSK). Будем информировать Вас о ходе работ, информация будет доступна в виде новости в панели управления аккаунтом (support.infobox.ru).

Я(2012-07-31 09:00:44 MSK): 5 сайтов выдают ошибки!

ТП(2012-07-31 09:49:37): Мы будем отслеживать работоспособность сайтов из приведенного Вами списка и сообщим Вам. Пожалуйста, ожидайте дополнительной информации до 12:00.

Я(2012-07-31 10:25:20 MSK): Сколько можно откладывать время? Вы уже сутки не можете нормально решить проблему.

ТП(2012-07-31 11:19:54 MSK): Приносим Вам свои извинения за длительное решение вопроса. Чтобы ускорить решение проблемы для Вас, мы можем перенести Ваш аккаунт на другой сервер по Вашему запросу в данном тикете. Перенос займет около часа. (Но переносить готовы только в ночное время!)

Я(2012-07-31 13:38:06 MSK): Зачем переносить аккаунт когда нужно всего лишь исправить ошибки на двух сайтах???

ТП(2012-07-31 14:37:19 MSK): После операции восстановления работоспособность сайтов по большей части восстановлена. Сейчас наблюдаются единичные случаи неработоспособности отдельных сайтов, связанные с конфликтом настроек. Мы работаем над исправлением этих точечных неполадок. Мы сообщим Вам о ходе работ до 18:00.

Я(2012-07-31 15:14:11 MSK): Если я подтвержу перенос сейчас, как быстро вы перенесете сайты на другой сервер?

ТП(2012-07-31 18:13:31 MSK): К сожалению, восстановление заняло больше времени. Пожалуйста, ожидайте информации до 21:00.

Вот таким образом более 40 сайтов недоступны уже более 30 часов. Страницы вылетают из индекса, все биржи выдают ошибки, я теряю доход от контекстной рекламы. Кто прав кто виноват?

P.S. Я не спорю что этот пост нытье, но хотел бы предостеречь вебмастеров от использования данного хостинга, хоть компания и является одной из крупнейшей на рынке, оказалось что техподдержка за 2 дня не может решить проблему одного сервера из 200 или 300 существующих в дата центре :(

FairyHosting.com
На сайте с 23.09.2010
Offline
191
#1

Проблема с дисковой подсистемой очень часто является затяжной и в случае, если например нужно скопировать данные с полумертвого диска на живой - это очень много времени.

Возможно после замены идет ребилд, из-за чего большая нагрузка на сервер и Ваши сайты дают ошибки, возможно ещё что то.

Но я Вам скажу по опыту, что лучше подождать пока идет восстановление и полностью убедиться в сохранности данных, чем терять данные...

Аренда виртуальных и выделенных серверов в Эстонии. (http://fairyhosting.com/) Профессионально, конфиденциально, надёжно.
vandamme
На сайте с 30.11.2008
Offline
675
#2

не стоило держать все яйки в одной корзине, хотя думаю это наверное не все ваши сайты.

сам лично заметил что чем крупнее компания, тем более наплевательски относятся к клиентам

чем меньше компания, тем более бережно они относятся к каждому клиенту, они боятся его потерять ☝

поэтому держу сайты в более мелких компаниях и в целом еще ни разу не подводили..

---------- Добавлено 31.07.2012 в 18:00 ----------

FairyHosting.com:
если например нужно скопировать данные с полумертвого диска

а нафиг тогда рейд придумали, зеркалирование данных и тд и тп?

rustelekom
На сайте с 20.04.2005
Offline
543
#3

Здравствуйте

К сожалению, это вполне реальная техническая ситуация и техподдержка тут совершенно ни при чем. Объясню на пальцах. Представьте себе, что жесткий диск- это RAID10 массив емкостью скажем в 2-6 Терабайт. И вот, ему приходит конец. Мало того, что надо менять диски которые были повреждены, так еще надо ребильдить сам массив - а это может занять и сутки и двое, как повезет. В случае, если массив не восстанавливается, необходимо восстановить данные из бекапа. Скорость отдельных жестких дисков стандартна у всех компаний и энное количество мегабайт в секунду вы не переплюнете по своему желанию. Здесь прямая зависимость - 100 гигабайт данных восстановить быстрее чем 1000 или тем более 10000.

Пенять инфобоксу в данном конкретном случае абсолютно не стоит. Такое действительно могло случится везде и всюду.

60% скидка на VPS в США, 20% скидка в Нидерландах и 40% в Финляндии. Новые тарифы на AMD Ryzen 9950x с частотой до 5.7 ГГц со скидкой 40% RoboVPS https://www.robovps.biz
FairyHosting.com
На сайте с 23.09.2010
Offline
191
#4

vandamme, а Вы думаете если RAID стоит то проблем не может быть ? :)

Не раз видел, как вылетают контроллеры 3ware, adaptec... в том числе с батарейками. После вылета самого контроллера шанс данные потерять велик.

Да и отдельные диски бывает вылетают крайне неприятно и вручную данные с винтов приходится копировать.

raid - это не панацея от проблем.

U2
На сайте с 12.06.2012
Offline
19
#5

Они хотя бы работают и восстанавливают у меня сайт с файлами был сервер, за бекапы платились деньги как и просил того хостер, хостера не помню, но в один прекрастный момент полетел винт, не проблема бывает говорю восстановите бекап самый актуальный, ответ поверг меня в шок типа вы не заказывали бекапов, типа лесом идите за что деньги не понятно платись, в итоге был у меня старенький бекап просто сайт весь со всеми файлами весил порядка 60гб, тоесть у меня в бекапе не было большей части инфы в итоге потерял большую часть сайта, а с этим и трафа не мало, до сих пор сайт восстанавливаю...

Автоматизируй свои компании в Яндекс-Директ, Adwords, Вконтакте (http://context.apishops.com/102A7BFDEC6F64BBF0B2A41DEC1AC734.htm) Рекламная сеть Вконтакте (http://welcome.socialtank.ru/?lrRef=ThC6r)
BuxarNET
На сайте с 03.05.2008
Offline
117
#6
User24:
Они хотя бы работают и восстанавливают у меня сайт с файлами был сервер, за бекапы платились деньги как и просил того хостер, хостера не помню, но в один прекрастный момент полетел винт, не проблема бывает говорю восстановите бекап самый актуальный, ответ поверг меня в шок типа вы не заказывали бекапов, типа лесом идите за что деньги не понятно платись, в итоге был у меня старенький бекап просто сайт весь со всеми файлами весил порядка 60гб, тоесть у меня в бекапе не было большей части инфы в итоге потерял большую часть сайта, а с этим и трафа не мало, до сих пор сайт восстанавливаю...

Видимо бекап просто на тот же диск делали, но стыдно было признаться в этом :)

Обменник http://BuxarExchange.ru (http://BuxarExchange.ru) Хостинг http://Buxar-Host.ru (http://Buxar-Host.ru) Домены от 0.01$, Хостинг от 0.25$, VDS и VPN от 3$ Сервера от 65 Eur Линукс Мир http://LinuxMir.ru/ (http://LinuxMir.ru/) Переход с Windows на Linux
bugsmoran
На сайте с 18.02.2010
Offline
223
#7
rustelekom:
Представьте себе, что жесткий диск- это RAID10 массив емкостью скажем в 2-6 Терабайт. И вот, ему приходит конец. Мало того, что надо менять диски которые были повреждены, так еще надо ребильдить сам массив - а это может занять и сутки и двое, как повезет.

1) Как это так в Вашем примере конец пришел одновременно и контрллеру и всем 4-м дискам? Что за чудеса?

2) Ребилд - не время даунтайма. Ребил делается после того, как сервер вернули в норму. При ребилде все сайты открываются (только если скорость ребилда большая, то открываются медленно, но как правило ребилды ускоряют в ночь и тормозят днем)

Так что косяк Инфобокса - косяк их админов. А не форс-мажор.

root.serverside.ru
На сайте с 25.02.2010
Offline
98
#8

Ну вы даете, по-вашему на шареде не может быть форс-мажерных обстоятельств? Вам же отвечали что работают над проблемой, по-моему это наглость писать такие отзывы о людях, которые решали ваши проблемы и отвечали на ваши вопросы своевременно. Хотите полной независимости от железа - делайте на выделенных серверах round robin кластер разбросанный по разным странам, если деньги есть. Ато купили бюджетный шаред, а претензий на все 500 баксов в месяц, да еще на публику все потянули. Не серьезный отзыв.

K
На сайте с 11.08.2005
Offline
172
kpv
#9
bugsmoran:
Как это так в Вашем примере конец пришел одновременно и контрллеру и всем 4-м дискам? Что за чудеса?

Это вы у программистов спросите :) Это вообще может быть не аппаратная проблема. В результате каких либо действий (по питанию плохо дёрнули или ещё что-то) раздел на рейд массиве развалился. raid железка просто дублирует информацию на четырёх дисках - у вас есть, к примеру, четыре (или две, кому как больше нравится) одинаковых зеркальных копий развалившейся системы. RAID тут ничем не поможет.

Вполне реальные случаи - даже журналируемые системы разваливаются при неудачном стечении обстоятельств.

Хостинг в Рестоне (http://ruweb.ws/?page=price), Москве (http://ruweb.net/?page=price&type=unlim), Нижнем Новгороде (http://ruweb-nn.ru/hosting.html). Регистрация доменов, аренда серверов с администрированием.
root.serverside.ru
На сайте с 25.02.2010
Offline
98
#10
root.serverside.ru:
Ну вы даете, по-вашему на шареде не может быть форс-мажерных обстоятельств? Вам же отвечали что работают над проблемой, по-моему это наглость писать такие отзывы о людях, которые решали ваши проблемы и отвечали на ваши вопросы своевременно. Хотите полной независимости от железа - делайте на выделенных серверах round robin кластер разбросанный по разным странам, если деньги есть. Ато купили бюджетный шаред, а претензий на все 500 баксов в месяц, да еще на публику все потянули. Не серьезный отзыв.

p.s. У нас тоже был недавно случай - полиция конфисковала жесткие диски шаред хостинга (из-за одного кардера на сервере, без предупреждения!), при всем желании восстановить из бэкапов получилось только за 6 часов - физически невозможно быстрее, учитывая объемы информации. И слава Богу, все поняли сиуацию и не пошли "предостерегать вебмастеров" на форумы.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий