SSF/Backup Facility 運用手引書 |
目次
索引
![]() ![]() |
第3章 SSF/Backup Facilityの運用設計 |
SSF/Backup Facilityを含めた集中監視を行うためには、集中監視製品Systemwalker Centric Manager が必要です。
Systemwalker Centric Managerを使用して運用管理を実行するために、以下のような方針の元に運用方法を検討します。
運用管理に関する定型的な作業は、自動化を推奨します。運用管理手順の標準化を行い、人為的ミスを防止します。
運用管理に関する非定型な作業は、リモート操作などを用いて集中管理します。
Systemwalker Centric Managerで管理可能なIT資源を以下に示します。
TCP/IPプロトコルをベースとしたネットワーク
ネットワーク機器(ルータ、バブ)、サーバ機(UNIX、AT互換機)、プリンタなどIPを持ったハードウェア
UNIX(Solaris OS、HP-UX、AIX)、Linux、Windowsなどのオペレーティングシステム
データベース、グループウェアなどのミドルウェア、市販のソフトウェア、および顧客で作成したアプリケーションなどの実行ファイル
これらの資源を、すべて同一レベルで運用管理することは、多大の労力と時間、コストを必要とするため現実的ではありません。投資と効果のバランスを考慮し、運用管理の対象を選択するようにしてください。
Systemwalker Centric Managerで実施できる運用管理の項目を検討します。
検討内容 |
検討項目 |
定型的な作業 |
SSF/Backup Facilityの稼働状況を監視し、円滑な運行を管理する |
稼働監視 |
ログファイル、メッセージの監視 |
SSF/Backup Facilityの安定稼働を妨げるトラブルを検知する |
障害監視 |
− |
業務システムを安定稼働させるために、システムの性能を監視する |
性能監視 |
しきい値監視 |
運用管理の担当者によるトラブルの復旧を迅速に行い、円滑な運用を維持する |
障害復旧 |
− |
以下の方法で稼働状況を監視します。
定期的に監視対象機器へポーリングを実施し、応答の有無を監視します。これにより、ハードウェア/OSのダウンによる無応答状態を検出できます。
クラスタシステムからの異常メッセージを監視し、フェールオーバの発生を検出します。
特定アプリケーションの稼働状態(プロセスの存在)を監視します。
システムログファイルを監視し、アプリケーションのエラーメッセージを監視します。
ネットワーク機器によるSNMP Trapの送信を監視します。
上記の事象を、以下のいずれかの方法で管理者へ通知(自動通知)するように設定します。
管理者が使用するクライアントに対し、ポップアップメッセージを送信します。
音声、またはブザー音により、障害の発生を通知します。
また、緊急度が低い場合、または障害発生の履歴管理を行う場合、ログファイルに障害発生履歴を蓄積し、後日、障害状況が確認できるようにします。
障害が発生した場合、Systemwalkerコンソールに表示されるとともに、障害票、電話、ポケベルなどで担当者へ通報するように設定できます。通報手段は、障害の影響度と障害発生時刻によって選択できます。
ネットワーク、システム、アプリケーションの性能を監視し、安定したサービスを提供できるように検討します。
性能監視は、共用資源であるサーバ、ネットワーク、業務アプリケーションが対象となります。
性能監視作業は、以下の方法で実施します。
監視対象 |
監視の方法 |
サーバ |
CPU性能・メモリ使用量のしきい値監視を行います。 |
ネットワーク |
SNMP・MIBを使用したトラフィックのしきい値監視を行います。 |
業務アプリケーション |
アプリケーション毎の応答時間、CPU使用率の項目についてしきい値監視を行います。 |
障害に対する対処は、以下のように行います。
稼働監視で障害発生が検出された場合は、電話または障害票で管理者に通報されるように設定します。
過去に発生した障害履歴を検索し、類似する障害の原因及び対処方法を調査します。リモート操作を使用し、サーバ、ネットワークの稼働状況を確認し、原因箇所の特定を行います。
リモート操作、リモートコマンドなどを使用し、障害に対処します。リカバリフローで、障害に対する対処方法が設定されていれば、その手順に従って対処します。
障害票、ノウハウ票に障害の履歴を記録し、再発時の対応時間を短縮します。
|
|
|
目次
索引
![]() ![]() |