セルフチェック機能は以下の方法で有効にすることができます。
セルフチェック機能を有効にします。
# /opt/FJSVhanet/usr/sbin/hanetparam -e yes |
変更されたパラメタを確認します。
# /opt/FJSVhanet/usr/sbin/hanetparam print
[Fast switching]
Line monitor interval(w) :5
Line monitor message output (m) :0
Cluster failover (l) :5
Cluster failover in unnormality (c):OFF
Line status message output (s) :OFF
[NIC switching]
Standby patrol interval(p) :15
Standby patrol message output(o) :3
[Virtual NIC]
LinkDown detection time (q) :0
LinkUp detection time (r) :1
Link monitor starting delay (g) :5
[Common Setting]
Hostname resolution by file(h) :YES
Self-checking function(e) :YES |
システムをリブートします。リブート後、セルフチェック機能が有効になります。
また、無効にする方法は以下のとおりです。
セルフチェック機能を無効にします。
# /opt/FJSVhanet/usr/sbin/hanetparam -e no |
変更されたパラメタを確認します。
# /opt/FJSVhanet/usr/sbin/hanetparam print [Fast switching] Line monitor interval(w) :5 Line monitor message output (m) :0 Cluster failover (l) :5 Cluster failover in unnormality (c):OFF Line status message output (s) :OFF [NIC switching] Standby patrol interval(p) :15 Standby patrol message output(o) :3 [Virtual NIC] LinkDown detection time (q) :0 LinkUp detection time (r) :1 Link monitor starting delay (g) :5 [Common Setting] Hostname resolution by file(h) :YES |
システムをリブートします。リブート後、セルフチェック機能は無効になります。
セルフチェック機能の監視方法は以下のとおりです。定期的に仮想ドライバと制御デーモンを監視します。
監視対象は以下のとおりです。なお、システム全体のハングアップや異常状態は検出できません。
監視対象 | 異常種別 | 異常検出方法 |
---|---|---|
仮想ドライバ | ハングアップ検出 | 60秒間、仮想ドライバから応答がない |
I/Oエラー検出 | 5回連続で仮想ドライバから情報を取得できない | |
制御デーモン | ハングアップ検出 | 300秒間、制御デーモンから応答がない |
I/Oエラー検出 | 5回連続で制御デーモンから情報を取得できない | |
プロセス停止検出 | 制御デーモンのプロセスが存在しない |
異常を検出した場合、以下のようなメッセージがシステムログに出力されます。
仮想ドライバの異常を検出した場合
以下のメッセージを出力して監視機能が停止します。調査資料を採取後、システムをリブートしてください。
ERROR: 97427: sha driver error has been detected. code=xxx |
xxx:エラー種別。ハングアップ(hungup)、I/Oエラー(error)
制御デーモンの異常を検出した場合
以下のメッセージを出力します。メッセージ出力後、さらに300秒間、制御デーモンから応答がない場合には、監視機能が停止します。
ERROR: 97627: hanetctld error has been detected. code=xxx |
xxx:エラー種別。ハングアップ(hungup)、I/Oエラー(error)、プロセス停止(process)
ただし、制御デーモンが復旧した場合は、以下のメッセージを出力して監視を継続します。
INFO: 97727: hanetctld recovery has been detected. |
上記メッセージが出力されなかった場合、調査資料を採取後、システムをリブートしてください。
なお、以下の場所にスクリプトを配置することで異常を検出時にスクリプトを実行させることができます。詳細は、“3.12.2 ユーザコマンド実行機能の設定”を参照してください。
/etc/opt/FJSVhanet/script/system/monitor |
参考
監視機能の停止後はシステムのリブートを推奨します。
一時的な負荷により、ハングアップまたはI/Oエラーを検出した場合は、以下のようにセルフチェック機能を再起動することで復旧できます。
# /opt/FJSVhanet/etc/sbin/hanetmond |
セルフチェック機能の再起動に失敗した場合は、調査資料を採取し、当社技術員(SE)にエラーメッセージをお知らせください。
なお、セルフチェック機能の再起動に失敗した場合、システムのリソース不足や異常が発生している可能性があります。それらを解消するために、システムをリブートしてください。