レポート詳細: RAIDGroupXXXXに定義されるLogicalVolumeYYYYのレスポンスタイム遅延を検出しました。 関連すると予想される他の対象の監視状態は次の通りです。 <各CMの監視状態> ←(1) [CM0x00] 高負荷状態検出 [CM0x01] 未検出 [CM0x10] 未検出 [CM0x11] 未検出 RAIDGroupXXXXの監視状態:高負荷状態検出←(2) レスポンスタイム遅延を検出したI/Oのブロックサイズは8 Kbytesです。←(3) 関連するグラフ: LogicalVolumeYYYYのレスポンスタイムのグラフを参照してください。 対策の指針: 1. RAIDGroup高負荷状態の可能性があります。RAIDGroupビジー率(Disk使用率)のアラーム確認および対策の指針を参照してください。 2. CM高負荷状態の可能性があります。CMビジー率のアラーム確認および対策の指針を参照してください。ROEを搭載する装置の場合、 ROEが高負荷状態の可能性があります。ROE使用率の状態を確認してください。ROEが高負荷状態の場合、各CMの負荷状態を参考に、 負荷の低いCM担当下のRAIDGroupにI/Oを分散してください。 3. ブロックサイズが大きいためI/O処理に時間を要していると考えられます。閾値の見直しを行ってください。
LogicalVolume がレスポンス遅延を検出した同じ時間帯の各CMの状態を表示します。ただし、各 ROE の状態は表示しません。
高負荷状態検出 | 同じ時間帯で CM 負荷異常としてアラームログが作成されています。レスポンス遅延を検出した LogicalVolume の担当 CM が『高負荷状態検出』の場合、CM ネックによるレスポンス遅延の可能性があります。当該 CM のアラームの対策指針を行ってください。 |
監視継続中 | アラームとして検出されてはいませんが、何度か閾値を超えて、アラーム検出のため監視中の状態です。 |
未検出 |
|
LogicalVolume がレスポンス遅延を検出した同じ時間帯の当該 LogicalVolume が定義される RAIDGroup の状態を表示します。
高負荷状態検出 | 同じ時間帯で RAIDGroup 負荷異常としてアラームログが作成されています。RAID を構成する Disk ネックによるレスポンス遅延の可能性があります。当該 RAIDGroup のアラームの対策指針を行ってください。 |
監視継続中 | アラームとして検出されていませんが、何度か閾値を超えて、アラーム検出のため監視中の状態です。 |
未検出 |
|
LogicalVolume のレスポンス遅延を検出した時点の I/O ブロックサイズを表示します。
当該 LogicalVolume の担当 CM、担当 CM に属する ROE、定義される RAIDGroup が『高負荷状態検出』状態でない場合は、CM および Disk ネックではなく、閾値に対しての I/O ブロックサイズが大きいためアラームとなっている可能性があります。
例えば、LogicalVolume のレスポンス 30msec の閾値設定において、レスポンス遅延を検出した時に、CM および Disk ともネックではなく、かつ I/O ブロックサイズ 512Kbytes である場合は、I/O ブロックサイズが大きいことによるレスポンス遅延の可能性が最も高いと思われます。なお、一般的に I/O ブロックサイズが大きいほどレスポンスも大きくなります。レスポンス 30msec を基準とした時に、I/O ブロックサイズ=512Kbyte 以上である場合が、I/O ブロックサイズによるレスポンス遅延の目安になります。
LogicalVolume のレスポンス閾値を見直す、またはアプリ側で I/O ブロックサイズを小さくするなどの対処が必要です。