障害記録 UPS 2012/09/28
Posted on 2012/09/28(Fri) 22:40 in technical
本日のアクセス障害に関する障害記録。
- 11:02 ESXi動作マシンの電源故障により、収容仮想マシンがダウン(時間はログから推定)。仮想化されていたルータのダウンにより、全外向きサービスの不通となる
- 19:45 当初原因不明であったため、同マシンの電源を投入したところ、電力供給ライン上のUPSが短絡検出したことで当該UPSの電力供給が停止。これにより、UPS収容装置の全断が発生
- 19:50 故障電源を予備電源と入れ替えて再度起動
- 20:07 各監視アラートの対処を完了
今後の対応と対策
- どうしよっかー...
冷静にログ追ったら断時間が8時間5分とか、年間で言うと0.1%分の稼働率が吹っ飛んだことに...。
まぁメンテナンス入れたらもっと吹っ飛んでますけど。