**以前のリビジョンの文書です**
管理運用
- 死活監視
リソース監視
- リソース監視には、単純にH/Wのリソースを得るものと、各プロセスのリソース消費を得るものがある。
ログ監視
- 何のログ見てりゃいいかな。
復旧手順
想定される障害に対する復旧手順、または取得すべき情報の回収手順を記載しておきたいよね。
ハードウェア障害
- HDDが故障した場合
- Memory(non-ECC)が故障した場合
- Memory(ECC)が故障した場合
ソフトウェア障害
- バージョンアップによってサービスが立ち上がらなくなった場合
オペレーション障害
- 誤ってファイルを消去した場合
- ZFSによるsnapshotを取得している場合
- ファイルバックアップが存在する場合
その他
- 時刻同期の状態監視
- NTPDによる時刻の同期状況を監視する。これについては、リソース監視と同様に扱う。