Чому не працювала «Дія» та інші онлайн-сервіси — у De Novo назвали причини
Центр обробки даних De Novo завершив службове розслідування інциденту, який призвів до масштабного збою низки онлайн сервісів 26 квітня. Своїм аналізом поділилися з партнерами та клієнтами.
Нагадаємо, у суботу користувачі по всій Україні повідомили про збої в роботі застосунків «Дія», «Київ цифровий», «Ощадбанку», «Нової пошти» тощо. Ці сервіси хостяться на хмарному провайдері De Novo, який пізніше в той день повідомив про проблеми з живленням.
Сервіси перестали працювати після короткочасного збою в системі електроживлення, що стався о 08:03 ранку — кажуть у компанії. У їхньому аналізі йдеться, що це був не людський фактор і не кібератака, а «нестандартна реакція обладнання в процесі перемикання».
«Росіяни сюди не могли пройти технічно. Зламати цей дата-центр дистанційно фактично неможливо, — сказав Максим Агєєв під час закритої зустрічі з журналістами. — Сценарій роботи під час аварії був штатний та відпрацьований. Подібних аварій по різних дата-центрах у світі відбувають близько сотні на рік».
У звіті причину збою пояснюють так:
- Інцидент стався під час другого етапу планової модернізації джерел безперебійного живлення (ДБЖ) та заміни свинцево-кислотних батарей на літієві.
- Через аномальну роботу одного з магістральних автоматичних вимикачів вводу резерву (АВР) було тимчасово припинено подачу живлення на обидві гілки внутрішньої електромережі.
- Це призвело до знеструмлення систем дата-центру на 14 хвилин.
- Попри те, що роботу проблему виправили швидко, потрібно було активувати ІТ-системи з «холодного» стану. Це може зайняти десятки хвилин або навіть кілька годин.
- Хмара De Novo повністю відновила функціонування близько 9:45. В цілому, наслідки інциденту повністю ліквідували приблизно о 13:00.
- Щоб уникнути таких ситуацій, зняли з експлуатації обладнання з дефектом, яке й стало причиною аварії. Його замінять на сучасніше.
Максим Агєєв розповів, що за умовами договору з клієнтами можуть переривати подачу сервісу не більше ніж на 96 хвилин на рік. Проте, за його словами, De Novo працював без зупинки з листопада 2010 року.
Дата-центр має близько 150 клієнтів (з малими бізнесами майже не працюють). Про можливі компенсації не розказав через умови про нерозголошення. На питання журналістів про резервування даних відповів так:
«Ми не можемо резервувати дані без відома клієнта. Серед клієнтів, які просили резервування після інциденту, державних не було, але минуло кілька днів. Всі інші зараз розбираються із цим. Думаю, вони також зроблять висновки».
У звіті De Novo відзначили роботу команди, яка швидко відновила роботу після збою в системі електроживлення. Звільняти нікого не планують, сказав Максим Агєєв. «Усі відпрацювали у вищому режимі у повній темряві, до них жодних претензій. Регламент був виконаний на 100 %. Могло бути значно гірше».