**以前のリビジョンの文書です**
機器管理
死活監視
- 死活監視およびプロセス監視を継続的に行う。
- ただし、個人的理由による環境変更が度々行われるため、メールによる通知は行わないものとする。
- プロセス監視については、単にプロセスが動作していることを確認するものと、挙動が想定どおりであることを確かめるものがある。
- 監視対象プロセスまたはサービス
- 全般
- SSH
- NTPD
- Web
- Apache
- DB
- MySQL
- DNS
- BIND
- DHCP
- DHCPv6
- LDAP
- LDAP
- PPPoE Router
- mpd
- UPnP
- RA
- DHCPv6 Client
- DDNS
- FTP
- FTP
- SFTP
- AD
- AD
- Hyper-V
- Hyper-V
- VMware ESXi
- VM
リソース監視
- リソース監視には、単純にH/Wのリソースを得るものと、各プロセスのリソース消費を得るものがある。
ログ監視
- 何のログ見てりゃいいかな。
復旧手順
想定される障害に対する復旧手順、または取得すべき情報の回収手順を記載しておきたいよね。
ハードウェア障害
- HDDが故障した場合
- Memory(non-ECC)が故障した場合
- Memory(ECC)が故障した場合
ソフトウェア障害
- バージョンアップによってサービスが立ち上がらなくなった場合
オペレーション障害
- 誤ってファイルを消去した場合
- ZFSによるsnapshotを取得している場合
- ファイルバックアップが存在する場合
その他
- 時刻同期の状態監視
- NTPDによる時刻の同期状況を監視する。これについては、リソース監視と同様に扱う。