サーバの性能情報を収集するために使用しているOSコマンド、計算式、およびCPU使用率の監視方法のカスタマイズについては、“Systemwalker Centric Manager リファレンスマニュアル”を参照してください。
設定する項目 | 内容 | 設定画面 |
---|---|---|
[テンプレート種別] | サーバ性能を監視したいノードのOS種別にあわせてテンプレート種別を選択します。 | [サーバ性能の監視] |
[以下のしきい値で監視] | サーバ性能のしきい値情報を設定します。設定したしきい値を超えた場合、メッセージが通知されますので、サーバ性能を監視できます。 | [サーバ性能のしきい値設定] |
手順
[監視ポリシー[管理]]画面を起動します。
[オプション]メニューの[カスタムモード表示]にチェックが入っていることを確認します。チェックが入っていない場合は、[オプション]メニューの[カスタムモード表示]を選択することでチェックします。
[設定対象]の[ポリシー]-[性能監視]-[サーバ]-[被監視サーバのOS種別]を選択します。OS種別は、以下の6種類です。
Windows、Solaris、Linux、HP-UX、AIX、UXP/DS
[操作]メニューの[新規作成]を選択します。
→[監視ポリシー[ポリシーの作成]]画面が表示されます。
[ポリシー名]、[コメント名]を入力します。
[OK]ボタンをクリックします。
→[サーバ性能の監視]画面が表示されます。
[しきい値一覧]から、MIB取得するサーバ性能項目を選択し、[設定]ボタンをクリックします。
→[サーバ性能のしきい値設定]画面が表示されます。
しきい値を設定します。
→サーバ性能情報は、ここで設定する項目の「サンプリング回数」と「サンプリング間隔」とを掛けた値のタイミングで更新されます。
例えば、MIBしきい値条件を以下のように設定する
サンプリング回数:3回
サンプリング間隔:60秒
サーバ性能情報更新間隔:3*60=180秒
[OK]ボタンをクリックします。
監視を停止したサーバ性能の項目は、以下の操作では表示されません。
ノード中心マップ、ペアノード経路マップ
性能情報出力
ノード詳細画面(サーバ性能)
論理ディスク単位、ストレージプール単位にしきい値監視を行う場合
ディスク使用率およびディスク空き容量を、論理ディスク単位、ストレージプール単位にしきい値を変更し監視する場合、mptrfbypartコマンドを使用します。mptrfbypart(論理ディスク単位、ストレージプール単位の監視定義登録コマンド)コマンドの詳細については、“Systemwalker Centric Manager リファレンスマニュアル”を参照してください。
SVMの論理パーティションを監視する場合
SVM(Solaris Volume Manager)により作成した論理パーティションは、以下の監視項目において、物理ディスクと同様に個々のパーティションごとに表示、監視します。
ディスクビジー率
HD待ち要求数
HD空き容量の監視をしており、かつ、運用中にパーティションの容量を拡張した場合には、HD空き容量のしきい値を、拡張した容量に応じた値に変更してポリシーを再設定、配付してください。
Solaris のZFSでのディスク使用率とディスク空き容量を監視する場合
監視できるディスク空き容量の上限は、2097151MBです。ディスク空き容量が2.0TB以上の場合は、一律2097151MBとみなします。
また、Solaris のZFSでは、ストレージプールに割り当てられた領域の範囲で自動的に拡張するため、ディスク空き容量の収集に使用しているdfコマンドの出力結果に大幅な増減が発生する可能性があります。そのため、ストレージプール単位で監視してください。
詳細については、“論理ディスク単位、ストレージプール単位にしきい値監視を行う場合”を参照してください。
しきい値超え検出時の動作について
取得した性能情報が設定したしきい値を超えている場合、しきい値超えのアラームが通知されます。
しきい値超えの判定は、設定したサンプリング回数と判定基準値によって判断されます。
以下の設定をします。
サンプリング回数:5回
判定基準値:3回
この場合、5回サンプリングを行い、そのうち3回以上しきい値を超えていた場合しきい値超えのアラームが通知されます。
なお、しきい値超え状態が継続している場合、しきい値超えのアラームが通知されるのは、最初にしきい値を超えたときだけです。いったんしきい値超えの状態が復旧するまで、次のアラームは通知されません。
しきい値超え発生時のエラーメッセージについては、“Systemwalker Centric Manager メッセージ説明書”を参照してください。
インストールレス型エージェントでしきい値超えを検出したときの動作について
インストールレス型エージェントでしきい値超えを検出した場合、エージェント機能をインストールした場合と比べて、以下の差異があります。
しきい値超えメッセージの形式とIDが、以下の例のように異なります。
インストールレス型エージェントの場合の出力例
UX:MpTrfals: WARNING: 903: 監視項目(Percentage of hard disk usage)の値が上方警告レベルを上回りました。(資源名:disk-/work1, 測定値:9400, しきい値:4000, 検出回数:5, 検出基準回数:5)
インストール型エージェントの場合の出力例
UX:MpTrfExA: WARNING: 903: 監視項目(Percentage of hard disk usage)の値が上方警告レベルを上回りました。(資源名:disk-/work1, 測定値:9400, しきい値:4000, 検出回数:5, 検出基準回数:5)
しきい値超えメッセージの出力後、しきい値超え状態が解消したら復旧メッセージを出力しますが、出力済みのしきい値超えメッセージは自動的に対処済みとはなりません。
しきい値超え、および復旧メッセージが出力されてから、監視イベント一覧に表示されるまでに、最大でインストールレス型エージェント監視のシスログ/イベントログ監視機能の監視間隔に設定した時間分の遅れが発生します。
Linuxサーバを被監視サーバとして使用する場合
Linuxサーバを被監視サーバとして使用する場合、LinuxサーバでバンドルされているSNMPエージェント(UCD-snmpまたはNet-snmp)が、サーバ性能監視機能のSNMP要求に対し、応答を通知するように設定しておく必要があります。SNMPエージェントの設定方法は、“Systemwalker Centric Manager 導入手引書”を参照してください。
サーバ性能監視機能にて収集しているサーバ性能情報を、MIBで取得する方法
サーバ性能監視機能にて収集/監視しているサーバ性能情報は、一定期間分の情報をメモリ上に保持しているため、それらの情報をファイルに出力し、長期的なレポーティングを行うことができません。ただし、収集したサーバ性能情報は、SNMPの拡張MIBで提供しているため、Systemwalker Centric Manager のMIB取得機能のような、SNMP MIBを取得するアプリケーションソフトを使用することで、外部からサーバ性能情報を取得することができます。
Windows、Solaris、および V13.1.0以降の運用管理サーバからポリシー配付されたAIX、HP-UX、Linuxサーバが対象となります。
ただし、OSにより取得できない監視項目があります。取得できない監視項目に関しては、“Systemwalker Centric Manager リファレンスマニュアル”の“性能監視の監視項目一覧”を参照してください。
1. 性能監視拡張エージェントで収集する
サーバ性能情報は、Systemwalker Centric Manager 性能監視拡張エージェント(以降、拡張エージェントと呼びます)にて、定期的に収集します。
拡張エージェントは、以下のインストール種別を選択することで、標準でインストールされます。
運用管理サーバ
部門管理サーバ
業務サーバ(エージェントライセンス)
サーバ性能のMIBを取得する場合は、あらかじめサーバ性能監視機能のポリシー設定にて、取得したいサーバ性能項目の監視を選択してください。インストール後、ポリシーが設定されていない場合は、自動的に以下のサーバ性能項目を収集します。
ページフォルト数
CPU使用率
ディスクビジー率
性能情報の更新
拡張エージェントはポリシーの内容に従い、サーバ性能情報を収集します。収集した性能情報は、「サンプリング回数×サンプリング間隔」ごとに更新されます。初めて情報が取得されるのは、ポリシー適用から「サンプリング回数×サンプリング間隔」が経過してからです。しばらく時間が経過したら、[ノード詳細表示(サーバ性能)]画面にて、すべてのサーバ性能情報が収集されているか確認してください。
[ノード詳細表示(サーバ性能)]画面の起動方法は、“ノード詳細表示(サーバ性能)”を参照してください。
2. MIBを取得する
1.により拡張エージェントが収集するサーバ性能情報をMIBで取得できます。
実際にサーバ性能情報を取得するための、MIB OIDを説明します。
デバイス数MIB
CPUやディスクのようにデバイスが複数存在する場合があります。
以下のMIB OIDを取得することで、監視項目におけるデバイスの数を確認できます。
監視項目名 | MIB OID |
---|---|
ページフォルト数 | mpPfm.1.2 |
CPU使用率 | mpPfm.2.2 |
ディスクビジー率 | mpPfm.3.2 |
実メモリ使用率 | mpPfm.4.2 |
実メモリ空き容量 | mpPfm.5.2 |
ページファイル使用量 | mpPfm.6.2 |
ページファイル空き容量 | mpPfm.7.2 |
プロセス数 | mpPfm.8.2 |
プロセッサ待ちスレッド数 | mpPfm.9.2 |
HD空き容量 | mpPfm.10.2 |
HD使用率 | mpPfm.11.2 |
HD待ち要求数 | mpPfm.12.2 |
mpPfmは、「1.3.6.1.4.1.211.4.33」と置き換えてください。ただし、Systemwalker Centric Manager のMIB取得およびMIB監視では、そのまま「mpPfm」を使用できます。
デバイスが動的に追加または削除された場合、デバイス数MIBの値もそのときのデバイスの数に合わせて動的に変わります。
上記のMIB OIDに、さらに「インスタンス」が追加されます。
インスタンスはすべて「0」です。
例)
CPU使用率でのデバイス数を取得する場合
mpPfm.2.2.0
デバイス名MIB
デバイスが複数存在する場合、単純にサーバ性能MIBをすべて取得しても、どのMIBがどのデバイスの性能情報なのかを判断できなければ意味がありません。
以下のMIB OIDを取得することで、各監視項目におけるデバイスの名称を取得することができます。
監視項目名 | MIB OID |
---|---|
ページフォルト数 | mpPfm.1.3.1.2 |
CPU使用率 | mpPfm.2.3.1.2 |
ディスクビジー率 | mpPfm.3.3.1.2 |
実メモリ使用率 | mpPfm.4.3.1.2 |
実メモリ空き容量 | mpPfm.5.3.1.2 |
ページファイル使用量 | mpPfm.6.3.1.2 |
ページファイル空き容量 | mpPfm.7.3.1.2 |
プロセス数 | mpPfm.8.3.1.2 |
プロセッサ待ちスレッド数 | mpPfm.9.3.1.2 |
HD空き容量 | mpPfm.10.3.1.2 |
HD使用率 | mpPfm.11.3.1.2 |
HD待ち要求数 | mpPfm.12.3.1.2 |
mpPfmは、「1.3.6.1.4.1.211.4.33」と置き換えてください。
上記のMIB OIDに、さらに「インスタンス」が追加されます。
インスタンスはデバイス識別番号を表し、性能監視拡張エージェントの起動時に1から昇順に連続した値が割り当てられます。ただし、動的にデバイスが削除された場合、そのインスタンス番号は欠番になります。また、削除されたデバイスが同じデバイス名で再度追加された場合、以前と同じインスタンス番号が割り当てられます。異なる名前のデバイスが追加された場合は、インスタンス番号は新規に割り当てられます。
例)
起動時に5個のデバイスが存在し、動的に3番のデバイスが削除された場合の、デバイス数MIBとデバイス名のインスタンス
デバイス数MIB:4 |
上記のMIB OIDにて取得される情報は、システムから得られたデバイスの名称です。任意に設定することはできません。
例)
HD使用率のデバイス名MIBを取得
mpPfm.11.3.1.2.1--->disk-C: |
サーバ性能MIB
以下のMIB OIDを取得することで、各監視項目におけるデバイスごとのサーバ性能情報を取得できます。
監視項目名 | MIB OID |
---|---|
ページフォルト数 | mpPfm.1.3.1.7 |
CPU使用率 | mpPfm.2.3.1.7 |
ディスクビジー率 | mpPfm.3.3.1.7 |
実メモリ使用率 | mpPfm.4.3.1.7 |
実メモリ空き容量 | mpPfm.5.3.1.7 |
ページファイル使用量 | mpPfm.6.3.1.7 |
ページファイル空き容量 | mpPfm.7.3.1.7 |
プロセス数 | mpPfm.8.3.1.7 |
プロセッサ待ちスレッド数 | mpPfm.9.3.1.7 |
HD空き容量 | mpPfm.10.3.1.7 |
HD使用率 | mpPfm.11.3.1.7 |
HD待ち要求数 | mpPfm.12.3.1.7 |
mpPfmは、「1.3.6.1.4.1.211.4.33」と置き換えてください。
上記のMIB OIDに、さらに「インスタンス」が追加されます。デバイス名MIBのインスタンスと1対1に対応付けされています。
サーバ性能MIBを取得する間隔
サーバ性能監視では、ポリシーの「サンプリング間隔」ごとに情報を収集しています。
しかし、サーバ性能監視のしきい値判定は、「サンプリング回数×サンプリング間隔」を1サイクルとしています。そのため、MIBで取得できるサーバ性能情報は、「サンプリング間隔」ごとに収集した情報を、「サンプリング回数」で平均したものとなります。
つまり、サーバ性能MIBの情報が更新されるのは、「サンプリング回数×サンプリング間隔」ごとになります。
したがって、「サンプリング回数×サンプリング間隔」よりも短い間隔でサーバ性能MIBを取得しても、更新されないため、同じ値が取得されます。
実際にサーバ性能MIBを取得する間隔は、以下とすることが効率的となります。
サーバ性能MIB収集間隔 ≧ (サンプリング間隔×サンプリング回数) |
サーバ性能監視機能のしきい値監視の種類と判定基準
しきい値の種類
サーバ性能監視機能が判定するしきい値は、以下の4種類です。
異常検出上限
異常と判定する上限値を指定します。実測値が入力した値を上回ったとき、しきい値超えが通知されます。
警告検出上限
警告と判定する上限値を入力します。実測値が入力した値を上回ったとき、しきい値超えが通知されます。
警告検出下限
警告と判定する下限値を入力します。実測値が入力した値を下回ったとき、しきい値超えが通知されます。
異常検出下限
異常と判定する下限値を入力します。実測値が入力した値を下回ったとき、しきい値超えが通知されます。
個々のサーバシステムで、それぞれの性能項目について、どのようなしきい値で上記監視を行うかどうかを指定できます。
判定基準
サーバ性能監視機能は、性能データを以下のパラメタに従い、サンプリングとしきい値超えを判定します。
サンプリング回数
データを取得する回数を指定します。
サンプリングの間隔
秒単位でデータを取得する間隔を指定します。
しきい値
しきい値です。
判定基準
しきい値超えと判断するためのデータ数です。
しきい値超えの判定は、サンプリング回数分のデータ取得が完了したときに行われます。サンプリングしたデータ中、しきい値を超えたデータが判定基準以上の場合に、異常および警告のしきい値超えイベントが出力されます。
上記パラメタの指定により、以下のようなしきい値監視を行えます。
連続N回しきい値を超えた場合アラームを上げる
M回中N回しきい値を超えた場合アラームを上げる
サーバ性能監視機能は、しきい値超えイベントメッセージを一度発行すると、しきい値超え状態が復旧するまで再び発行しません。
サーバ性能監視機能では、しきい値超えが復旧したときに自動対処を行えます。