セルフチェック機能は以下の方法で有効にすることができます。
セルフチェック機能を有効にします。
# /opt/FJSVhanet/usr/sbin/hanetparam -e yes |
変更されたパラメタを確認します。
# /opt/FJSVhanet/usr/sbin/hanetparam print
[Fast switching]
Line monitor interval(w) :5
Line monitor message output (m) :0
Cluster failover (l) :5
Cluster failover in unnormality (c):OFF
Line status message output (s) :OFF
[NIC switching]
Standby patrol interval(p) :15
Standby patrol message output(o) :3
[Virtual NIC]
LinkDown detection time (q) :0
LinkUp detection time (r) :1
Link monitor starting delay (g) :5
[Common Setting]
Hostname resolution by file(h) :NO
Self-checking function(e) :YES |
システムをリブートします。再起動後、セルフチェック機能が有効になります。
また、無効にする方法は以下のとおりです。
状態監視機能を無効にします。
# /opt/FJSVhanet/usr/sbin/hanetparam -e no |
システムをリブートします。再起動後、セルフチェック機能は無効になります。
セルフチェック機能の監視方法は以下のとおりです。定期的に仮想ドライバと制御デーモンを監視します。
図3.25 セルフチェック機能の異常検出
監視対象は以下のとおりです。なお、システム全体のハングアップや異常状態は検出できません。
監視対象 | 異常種別 | 異常検出方法 |
---|---|---|
仮想ドライバ | ハングアップ検出 | 15秒間、仮想ドライバから応答がない |
I/Oエラー検出 | 5回連続で仮想ドライバから情報を取得できない | |
制御デーモン | ハングアップ検出 | 300秒間、制御デーモンから応答がない |
I/Oエラー検出 | 5回連続で制御デーモンから情報を取得できない | |
プロセス停止検出 | 制御デーモンのプロセスが存在しない |
異常を検出した場合、以下のようなメッセージがシステムログに出力されます。その後、監視機能は停止します。再度、監視を開始する場合は、調査資料を採取後、システムをリブートしてください。
ERROR: 97427: sha driver error has been detected. code=xxx |
xxx:エラー種別。ハングアップ(hungup)、I/Oエラー(error)
ERROR: 97627: hanetctld error has been detected. code=xxx |
xxx:エラー種別。ハングアップ(hungup)、I/Oエラー(error)、プロセス停止(process)
なお、以下の場所にスクリプトを配置することで異常を検出時にスクリプトを実行させることができます。詳細は、“3.12.2 ユーザコマンド実行機能の設定”を参照してください。
/etc/opt/FJSVhanet/script/system/monitor |