GLSは、制御デーモンと仮想ドライバを使用して、伝送路の高信頼化を実現しています。
セルフチェック機能は定期的にこれらの状態を監視して、動作に異常が発生した場合、ユーザに異常を通知します。セルフチェック機能は自動的に有効になります。
図2.45 セルフチェック機能による監視
注意
セルフチェック機能ではシステム全体の異常やハングアップを検出することはできません。クラスタを使用してください。
セルフチェック機能の監視方法は以下のとおりです。定期的に仮想ドライバと制御デーモンを監視します。
図2.46 セルフチェック機能の異常検出
監視対象は以下のとおりです。なお、システム全体のハングアップや異常状態は検出できません。
監視対象 | 異常種別 | 異常検出方法 |
---|---|---|
仮想ドライバ | ハングアップ検出 | 15秒間、仮想ドライバから応答がない |
I/Oエラー検出 | 5回連続で仮想ドライバから情報を取得できない | |
制御デーモン | ハングアップ検出 | 300秒間、制御デーモンから応答がない |
I/Oエラー検出 | 5回連続で制御デーモンから情報を取得できない | |
プロセス停止検出 | 制御デーモンのプロセスが存在しない |
異常を検出した場合、以下のようなメッセージがシステムログに出力されます。その後、監視機能は停止します。再度、監視を開始する場合は、調査資料を採取後、システムをリブートしてください。
仮想ドライバの異常を検出した場合
以下のメッセージを出力して監視機能が停止します。
ERROR: 97427: sha driver error has been detected. code=xxx |
xxx:エラー種別。ハングアップ(hungup)、I/Oエラー(error)
制御デーモンの異常を検出した場合
以下のメッセージを出力します。メッセージ出力後、さらに300秒間、制御デーモンから応答がない場合には、監視機能が停止します。
ERROR: 97627: hanetctld error has been detected. code=xxx |
xxx:エラー種別。ハングアップ(hungup)、I/Oエラー(error)、プロセス停止(process)
ただし、制御デーモンが復旧した場合は、以下のメッセージを出力して監視を継続します。
ERROR: 97727: hanetctld recovery has been detected. |
なお、以下の場所にスクリプトを配置することで異常を検出時にスクリプトを実行させることができます。詳細は、“3.6.10 ユーザコマンド実行機能の設定”を参照してください。
/etc/opt/FJSVhanet/script/system/monitor |
参考
監視機能の停止後はシステムのリブートを推奨します。
一時的な負荷により、ハングアップまたはI/Oエラーを検出した場合は、以下のようにセルフチェック機能を再起動することで復旧できます。
# svcadm restart fjsvhanet-poll |
セルフチェック機能の再起動に失敗した場合は、調査資料を採取し、当社技術員(SE)にエラーメッセージをお知らせください。
なお、セルフチェック機能の再起動に失敗した場合、システムのリソース不足や異常が発生している可能性があります。それらを解消するために、システムをリブートしてください。