Операторы ЦОД в большинстве своем непрерывно ведут поиск идеального баланса между отказоустойчивостью инфраструктуры дата-центра с одной стороны, а также уровнем капитальных и эксплуатационных расходов - с другой. Все они хотят, чтобы IT-оборудование было онлайн, когда оно нужно бизнесу. Тем не менее, во многих случаях это сопряжено с чрезмерно высокими тратами. Но экономия подчас чревата продолжительными даунтаймами, которые имеют ужасающие последствия. Из этой статьи вы узнаете об одном таком инциденте, который случился в начале января в дата-центре телекоммуникационной компании Verizon. Вы также сможете ознакомиться с результатами свежего исследования Vertiv, касающегося стоимостной оценки последствий даунтаймов ЦОД.
Даунтайм в дата-центре Verizon привел к перебоям в работе авиакомпании JetBlue
Недавний даунтайм в американском дата-центре телекоммуникационного гиганта Verizon привел к сбою в работе электронных систем авиаперевозчика JetBlue Airways, результатом чего стали задержки рейсов и закрытие сайт авиакомпании вместе с системами онлайн-бронирования билетов и регистрации, мобильными приложениями JetBlue и системой поддержки клиентов.
Причиной даунтайма стало отключения электроэнергии в центре обработки данных Verizon. Сбой в работе ЦОД произошел во время осуществления плановых работ по техническому обслуживанию инфраструктуры. Ошибка инженера вызвала сбой в подаче электричества. Проблемы начались в 11:30 утра по местному времени. Работоспособность ЦОД была восстановлена только в 8 вечера.
Следствием инцидента стала задержка более 200 авиарейсов JetBlue. Копания переложила всю ответственность за случившееся на Verizon и потребовала от своего IT-партнёра объяснений. Интересно, что в пресс-службе Verizon комментировать инцидент оказались.
Emerson и Ponemon оценили финансовые последствия даунтаймов ЦОД
Компания Vertiv в сотрудничестве с Ponemon Institute подготовила доклад под названием «Cost of Data Center Outages 2016», в котором приводится стоимостная оценка затрат, связанных с незапланированными простоями дата-центров. При подготовке доклада специалисты Vertiv и Ponemon Institute опросили операторов 63 американских дата-центров, которые сталкивались с даунтаймами один или несколько раз в течение последних 12 месяцев.
Отметим, что две организации периодически проводят подобные исследования (аналогичные доклады были опубликованы в 2010 и 2013 гг.). Что касается нового доклада, основные выводы выглядят следующим образом:
- Средняя общая стоимость минуты незапланированного даунтайма ЦОД стабильно увеличивается из года в год . Показатель вырос с $ 5617 в 2010 году до $ 7908 в 2013 году. В свежем докладе аналогичный показатель составил $ 8851.
- Средняя общая стоимость простоя дата-центра выросла с $ 505 502 в 2010 году до $ 690 204 в 2013 году и до $ 740 357 по итогам свежего исследования. Таким образом, произошло 38-проетентное увеличение стоимости простоя с момента первого исследования в 2010 году.
- Максимальный размер незапланированных расходов, вызванных даунтаймом ЦОД, вырос более существенно, чем средний уровень. Показатель увеличился на 81% с 2010 года. По итогам свежего исследования он составил $ 2 409 991.
- Причиной № 1 незапланированных простоев дата-центра были признаны отказы систем ИБП и их батарей. Свежее исследование показало, что на долю подобных инцидентов сейчас приходится около четверти всех даунтаймов. При этом эксперты фиксируют быстрый рост числа инцидентов, связанных с кберпреступностью (доля даунтаймов по причине кибератак увеличилась с 2% в 2010 году до 18% в 2013 году и до 22% по результатам свежего исследования).
По словам представителей Emerson, целью исследования было предоставление всем заинтересованным сторонам информации относительно того, столько именно стоят даунтаймы ЦОД. Ознакомившись с этими сведениями, топ-менеджеры смогут принимать более взвешенные бизнес-решения относительно финансирования инфраструктуры корпоративных дата-центров для смягчения последствий дорогостоящих даунтаймов.
Авторы исследования также отметили, что сложность современных дата-центров продолжает создавать проблемы операторам ЦОД, которые стремятся уменьшить риск дорогостоящих перебоев в работе инфраструктуры подконтрольных дата-центров.