Systemwalker Centric Manager 使用手引書 監視機能編 - UNIX/Windows(R)共通 - |
目次
索引
![]() ![]() |
第2部 設定 | > 第4章 [監視ポリシー]の設定 | > 4.2 性能監視 |
サーバの性能情報を収集するために使用しているOSコマンド、および計算式については、“Systemwalker Centric Manager リファレンスマニュアル”を参照してください。
設定する項目 |
内容 |
設定画面 |
[テンプレート種別] |
サーバ性能を監視したいノードのOS種別にあわせてテンプレート種別を選択します。 |
[サーバ性能の監視] |
[以下のしきい値で監視] |
サーバ性能のしきい値情報を設定します。設定したしきい値を超えた場合、メッセージが通知されますので、サーバ性能を監視できます。 |
[サーバ性能のしきい値設定] |
→[監視ポリシー[ポリシーの作成]]画面が表示されます。
→[サーバ性能の監視]画面が表示されます。
→[サーバ性能のしきい値設定]画面が表示されます。
→サーバ性能情報は、ここで設定する項目の“サンプリング回数”と“サンプリング間隔”とを掛けた値のタイミングで更新されます。
例えば、MIBしきい値条件を以下のように設定する
サーバ性能情報更新間隔:3*60=180秒
監視を停止したサーバ性能の項目は、以下の操作では表示されません。
ディスク使用率およびディスク空き容量を、論理ディスク単位にしきい値を変更し監視する場合、mptrfbypartコマンドを使用します。mptrfbypart(論理ディスク単位の監視定義登録コマンド)コマンドの詳細については、“Systemwalker Centric Manager リファレンスマニュアル”を参照してください。
監視できるディスク空き容量の上限は、2097151MBです。ディスク空き容量が2.0TB以上の場合は、一律2097151MBとみなします。
また、Solaris ZFSは、ストレージプールに割り当てられた領域の範囲で自動的に拡張するため、ディスク空き容量の収集に使用しているdfコマンドの出力結果に大幅な増減が発生する可能性があります。そのため、以下を考慮してしきい値を設定してください。
しきい値超えの判定は、設定したサンプリング回数と判定基準値によって判断されます。
判定基準値:3回
この場合、5回サンプリングを行い、そのうち3回以上しきい値を超えていた場合しきい値超えのアラームが通知されます。
なお、しきい値超え状態が継続している場合、しきい値超えのアラームが通知されるのは、最初にしきい値を超えたときだけです。いったんしきい値超えの状態が復旧するまで、次のアラームは通知されません。
しきい値超え発生時のエラーメッセージについては、“Systemwalker Centric Manager メッセージ説明書”を参照してください。
Linuxサーバを被監視サーバとして使用する場合、LinuxサーバでバンドルされているSNMPエージェント(UCD-snmpまたはNet-snmp)が、サーバ性能監視機能のSNMP要求に対し、応答を通知するように設定しておく必要があります。SNMPエージェントの設定方法は、“Systemwalker Centric Manager 導入手引書”を参照してください。
サーバ性能監視機能にて収集/監視しているサーバ性能情報は、一定期間分の情報をメモリ上に保持しているため、それらの情報をファイルに出力し、長期的なレポーティングを行うことができません。ただし、収集したサーバ性能情報は、SNMPの拡張MIBで提供しているため、Systemwalker Centric Manager のMIB取得機能のような、SNMP MIBを取得するアプリケーションソフトを使用することで、外部からサーバ性能情報を取得することができます。
WindowsおよびSolarisのサーバが対象となります。
サーバ性能情報は、Systemwalker Centric Manager 性能監視拡張エージェント(以降、拡張エージェントと呼びます)にて、定期的に収集します。
拡張エージェントは、以下のインストール種別を選択することで、標準でインストールされます。
拡張エージェントがインストールされると、自動的に以下のサーバ性能項目を収集します。
上記以外のサーバ性能項目もMIB取得する場合は、あらかじめ、サーバ性能監視機能のポリシー設定にて、取得したいサーバ性能項目の監視を選択してください。
拡張エージェントはポリシーの内容に従い、サーバ性能情報を収集します。収集した性能情報は、「サンプリング回数×サンプリング間隔」ごとに更新されます。初めて情報が取得されるのは、ポリシー適用から「サンプリング回数×サンプリング間隔」が経過してからです。しばらく時間が経過したら、「ノード詳細表示(サーバ性能)」画面にて、すべてのサーバ性能情報が収集されているか確認してください。
[ノード詳細表示(サーバ性能)]画面の起動方法は、“ノード詳細表示(サーバ性能)”を参照してください。
1.により拡張エージェントが収集するサーバ性能情報をMIBで取得できます。
実際にサーバ性能情報を取得するための、MIB OIDを説明します。
CPUやディスクのようにデバイスが複数存在する場合があります。
以下のMIB OIDを取得することで、監視項目におけるデバイスの数を確認できます。
監視項目名 |
MIB OID |
ページフォルト数 |
mpPfm.1.2 |
CPU使用率 |
mpPfm.2.2 |
ディスクビジー率 |
mpPfm.3.2 |
実メモリ使用率 |
mpPfm.4.2 |
実メモリ空き容量 |
mpPfm.5.2 |
ページファイル使用量 |
mpPfm.6.2 |
ページファイル空き容量 |
mpPfm.7.2 |
プロセス数 |
mpPfm.8.2 |
プロセッサ待ちスレッド数 |
mpPfm.9.2 |
HD空き容量 |
mpPfm.10.2 |
HD使用率 |
mpPfm.11.2 |
HD待ち要求数 |
mpPfm.12.2 |
インスタンスはすべて“0”です。
例)CPU使用率でのデバイス数を取得する場合
mpPfm.2.2.0 |
デバイスが複数存在する場合、単純にサーバ性能MIBをすべて取得しても、どのMIBがどのデバイスの性能情報なのかを判断できなければ意味がありません。
以下のMIB OIDを取得することで、各監視項目におけるデバイスの名称を取得することができます。
監視項目名 |
MIB OID |
ページフォルト数 |
mpPfm.1.3.1.2 |
CPU使用率 |
mpPfm.2.3.1.2 |
ディスクビジー率 |
mpPfm.3.3.1.2 |
実メモリ使用率 |
mpPfm.4.3.1.2 |
実メモリ空き容量 |
mpPfm.5.3.1.2 |
ページファイル使用量 |
mpPfm.6.3.1.2 |
ページファイル空き容量 |
mpPfm.7.3.1.2 |
プロセス数 |
mpPfm.8.3.1.2 |
プロセッサ待ちスレッド数 |
mpPfm.9.3.1.2 |
HD空き容量 |
mpPfm.10.3.1.2 |
HD使用率 |
mpPfm.11.3.1.2 |
HD待ち要求数 |
mpPfm.12.3.1.2 |
例)起動時に5個のデバイスが存在し、動的に3番のデバイスが削除された場合の、デバイス数MIBとデバイス名のインスタンス
デバイス数MIB:4 インスタンス:1、2、4、5(3が欠番) |
例)HD使用率のデバイス名MIBを取得
mpPfm.11.3.1.2.1--->disk-C: mpPfm.11.3.1.2.2--->disk-D: |
以下のMIB OIDを取得することで、各監視項目におけるデバイスごとのサーバ性能情報を取得できます。
監視項目名 |
MIB OID |
ページフォルト数 |
mpPfm.1.3.1.7 |
CPU使用率 |
mpPfm.2.3.1.7 |
ディスクビジー率 |
mpPfm.3.3.1.7 |
実メモリ使用率 |
mpPfm.4.3.1.7 |
実メモリ空き容量 |
mpPfm.5.3.1.7 |
ページファイル使用量 |
mpPfm.6.3.1.7 |
ページファイル空き容量 |
mpPfm.7.3.1.7 |
プロセス数 |
mpPfm.8.3.1.7 |
プロセッサ待ちスレッド数 |
mpPfm.9.3.1.7 |
HD空き容量 |
mpPfm.10.3.1.7 |
HD使用率 |
mpPfm.11.3.1.7 |
HD待ち要求数 |
mpPfm.12.3.1.7 |
サーバ性能MIBを取得する間隔
サーバ性能監視では、ポリシーの「サンプリング間隔」ごとに情報を収集しています。
しかし、サーバ性能監視のしきい値判定は、「サンプリング回数×サンプリング間隔」を1サイクルとしています。そのため、MIBで取得できるサーバ性能情報は、「サンプリング間隔」ごとに収集した情報を、「サンプリング回数」で平均したものとなります。
つまり、サーバ性能MIBの情報が更新されるのは、「サンプリング回数×サンプリング間隔」ごとになります。
従って、「サンプリング回数×サンプリング間隔」よりも短い間隔でサーバ性能MIBを取得しても、更新されないため、同じ値が取得されます。
実際にサーバ性能MIBを取得する間隔は、以下とすることが効率的となります。
サーバ性能MIB収集間隔 ≧ (サンプリング間隔×サンプリング回数) |
サーバ性能監視機能が判定するしきい値は、以下の4種類です。
異常と判定する上限値を指定します。実測値が入力した値を上回ったとき、しきい値超えが通知されます。
警告と判定する上限値を入力します。実測値が入力した値を上回ったとき、しきい値超えが通知されます。
警告と判定する下限値を入力します。実測値が入力した値を下回ったとき、しきい値超えが通知されます。
異常と判定する下限値を入力します。実測値が入力した値を下回ったとき、しきい値超えが通知されます。
個々のサーバシステムで、それぞれの性能項目について、どのようなしきい値で上記監視を行うかどうかを指定できます。
サーバ性能監視機能は、性能データを以下のパラメタに従い、サンプリングとしきい値超えを判定します。
データを取得する回数を指定します。
秒単位でデータを取得する間隔を指定します。
しきい値です。
しきい値超えと判断するためのデータ数です。
しきい値超えの判定は、サンプリング回数分のデータ取得が完了したときに行われます。サンプリングしたデータ中、しきい値を超えたデータが判定基準以上の場合に、異常および警告のしきい値超えイベントが出力されます。
上記パラメタの指定により、以下のようなしきい値監視を行えます。
サーバ性能監視機能は、しきい値超えイベントメッセージを一度発行すると、しきい値超え状態が復旧するまで再び発行しません。
サーバ性能監視機能では、しきい値超えが復旧したときに自動対処を行えます。
目次
索引
![]() ![]() |