対象バージョンレベル
Systemwalker Centric Manager
Windows版:V5.0L10以降
Solaris版:5.0以降
HP-UX版:5.1以降
AIX版:10.0以降
Linux版:5.2、V10.0L10以降
原因
しきい値はデフォルト値が設定されています。その値を超えた場合にアラームが通知されます。
サーバ性能の場合
サーバ性能の収集は、OSインタフェースを使用しています。OSインタフェースについては、“Systemwalker Centric Manager メッセージ説明書”の“サーバ性能情報の収集インタフェース”を参照してください。
Windowsのディスク関連の性能情報(ディスクビジー率、ディスク空き容量、ディスク使用率、ディスク待ち要求数)を監視している場合、OSのアプリケーションインタフェースを介してディスクへのアクセスが発生します。よって、ディスクのバックアップ等を行う場合に、OSのエラーメッセージが出力されるため、性能監視のサービス(Systemwalker MpTrfExA)を停止してから実施してください。
サーバ性能監視機能は、性能データを以下のパラメタに従い、サンプリングとしきい値超えを判定します。
パラメタ | 説明 |
---|---|
サンプリング回数 | データを取得する回数を指定します。 |
サンプリングの間隔 | 秒単位でデータを取得する間隔を指定します。 |
しきい値 | しきい値を指定します。 |
判定基準 | しきい値超えを判断するためのデータ数です。 |
しきい値超えの判定は、サンプリング回数分のデータ取得が完了した時に行われます。サンプリングしたデータ中、しきい値を超えたデータが判定基準以上の場合に、異常および警告のしきい値超えイベントが出力されます。
[表:パラメタと説明]のパラメタの指定により、以下のようなしきい値監視を行うことができます。
例)連続N回しきい値を超えた場合アラームを上げる
異常検出上限:90%
警告検出上限:85%
異常検出判定基準:3回
警告検出判定基準:3回
サンプリング回数:3回
サンプリング間隔:60秒
| | | * * | | | * | * | -+------------+-----------+-----------+--90% | | * | | | * | * | | -+------------+-----------+-----------+--85% | * * | | | | | | | |← (1) →|← (2) →|← (3) →| (1):しきい値超えではない (2):上方警告レベルのしきい値超え (3):上方異常レベルのしきい値超え |
例)M回中N回しきい値を超えた場合アラームを上げる
異常検出判定基準:2回
サンプリング回数:3回
| | | * * | | | * | | -+------------+-----------+-----------+--検出上限 | * * * | * * | * | | | | | | | | | |← (1) →|← (2) →|← (3) →| (1):しきい値超えではない (2):しきい値超えではない (3):しきい値超え |
サーバ性能監視機能は、しきい値超えイベントメッセージを一度発行すると、しきい値超え状態が復旧するまで再び発行しません。
例)イベントメッセージの出力タイミング
| | | | | | | | | * | * | * | | * | -+-----+-----+-----+-----+-----+-----+--検出上限 | * | | | | * | | | | | | | | | | | | | | | | | (1) | (2) | (3) | (4) | (5) | (6) | (1):しきい値超えではない (2):しきい値超え → イベントメッセージ発行 (3):しきい値超え (4):しきい値超え (5):しきい値超えではない (6):しきい値超え → イベントメッセージ発行 |
サーバ性能監視機能では、しきい値超えが復旧したときに自動対処を行うことが可能です。
ネットワーク性能の場合
ネットワーク性能の監視では、SNMPのMIB情報をもとに性能情報を収集しています。収集するMIB情報については、以下のマニュアルを参照してください。
V10.0L10/10.0~V13.3.0
“Systemwalker Centric Manager リファレンスマニュアル”の“付録C 性能監視の監視項目一覧”
V5.0L10/5.0~V5.0L30/5.2
“SystemWalker/CentricMGR V5.0L30 解説書”の“評価”
ネットワーク性能のサーバ性能(基本情報)は、性能監視拡張エージェントが収集した拡張MIBの値を収集しています。ネットワーク性能のサーバ性能(基本情報)を監視している場合、サーバ性能監視機能のポリシー設定のポーリング間隔が長いことにより、ネットワーク性能のマップ表示、レポート情報、アラーム通知が、実際のOSで発生していた時間より、遅れて収集されることがあります。
サーバ性能(基本情報)は、以下の3項目です。
CPU使用率 (Percentage of CPU usage) |
ディスクビジー率 (Percentage of disk time) |
ページフォルト数 (Page faults per second) |
例)
サーバ性能監視機能のポリシー設定
サンプリング間隔:300秒
サンプリング回数:30回
300秒間隔で30回収集した平均値がMIBに反映されます。本設定の場合、MIBの更新タイミングは 9000秒(150分) となります。
ネットワーク性能監視機能の設定
性能監視情報収集間隔:60分
性能監視情報採取ポーリング間隔:2分
2分間隔で採取した値の60分間における平均値をログに蓄積する。
[サーバ性能監視機能のMIB値の推移] 0 150 300 450 時間(分) +---------+--------+----------+----- 30 96 20 MIBの値(%) ▲ イベント出力 [ネットワーク性能機能の性能情報の推移] 0 60 180 300 240 時間(分) +---+---+---+---+---+---+---+---+--- 30 30 63 96 96 20 20 収集したMIBの平均値(%) |
上記のとおり、ネットワーク性能監視機能で収集した値は、サーバ性能監視のイベントが出力した時間と比較すると遅延して出力しているように見えます。
対処方法
以下のように、性能値の推移する状況に応じて、運用との関連性がないかを観点に確認します。
徐々に増加する傾向がみられる場合
業務アプリケーションなどをシステムに追加した、利用方法が変更となったなど、環境の変化が原因となっていないか確認します。
突発的に発生した場合
発生した時間帯で、一時的に業務アプリの処理量が増加したことなどが考えられます。定期的に発生する場合には、バッチジョブなどが動作する時間帯か確認します。
上記を確認後、通常の運用でも発生する場合は、システムとしての性能は、問題ないと判断することができます。この場合は、しきい値のチューニングを実施してください。なお、しきい値超えの項目がページフォルト数の場合、頻繁にしきい値超えが発生していなければ、対処は不要です。