ページの先頭行へ戻る
PRIMECLUSTER Global Link Services 説明書 4.6 (伝送路二重化機能編)
FUJITSU Software

3.11.2 セルフチェック機能

3.11.2.1 セルフチェック機能の設定方法

セルフチェック機能は以下の方法で有効にすることができます。

  1. セルフチェック機能を有効にします。

    # /opt/FJSVhanet/usr/sbin/hanetparam -e yes
  2. 変更されたパラメタを確認します。

    # /opt/FJSVhanet/usr/sbin/hanetparam print
    [Fast switching]
       Line monitor interval(w)           :5
       Line monitor message output (m)    :0
       Cluster failover (l)               :5
       Cluster failover in unnormality (c):OFF
       Line status message output (s)     :OFF
    
    [NIC switching]
       Standby patrol interval(p)         :15
       Standby patrol message output(o)   :3
    
    [Virtual NIC]
       LinkDown detection time (q)        :0
       LinkUp detection time (r)          :1
       Link monitor starting delay (g)    :5
    
    [Common Setting]
       Hostname resolution by file(h)     :YES
       Self-checking function(e)          :YES
  3. システムをリブートします。リブート後、セルフチェック機能が有効になります。


また、無効にする方法は以下のとおりです。

  1. セルフチェック機能を無効にします。

    # /opt/FJSVhanet/usr/sbin/hanetparam -e no
  2. 変更されたパラメタを確認します。

    # /opt/FJSVhanet/usr/sbin/hanetparam print
    [Fast switching]
       Line monitor interval(w)           :5
       Line monitor message output (m)    :0
       Cluster failover (l)               :5
       Cluster failover in unnormality (c):OFF
       Line status message output (s)     :OFF
    
    [NIC switching]
       Standby patrol interval(p)         :15
       Standby patrol message output(o)   :3
    
    [Virtual NIC]
       LinkDown detection time (q)        :0
       LinkUp detection time (r)          :1
       Link monitor starting delay (g)    :5
    
    [Common Setting]
       Hostname resolution by file(h)     :YES
    Self-checking function(e) :NO
  3. システムをリブートします。リブート後、セルフチェック機能は無効になります。

3.11.2.2 セルフチェック機能の異常検出

セルフチェック機能の監視方法は以下のとおりです。定期的に仮想ドライバと制御デーモンを監視します。

図3.26 セルフチェック機能の異常検出

監視対象は以下のとおりです。なお、システム全体のハングアップや異常状態は検出できません。

監視対象

異常種別

異常検出方法

仮想ドライバ

ハングアップ検出

60秒間、仮想ドライバから応答がない

I/Oエラー検出

5回連続で仮想ドライバから情報を取得できない

制御デーモン

ハングアップ検出

300秒間、制御デーモンから応答がない

I/Oエラー検出

5回連続で制御デーモンから情報を取得できない

プロセス停止検出

制御デーモンのプロセスが存在しない

異常を検出した場合、以下のようなメッセージがシステムログに出力されます。

なお、以下の場所にスクリプトを配置することで異常を検出時にスクリプトを実行させることができます。詳細は、“3.12.2 ユーザコマンド実行機能の設定”を参照してください。

/etc/opt/FJSVhanet/script/system/monitor

参考

監視機能の停止後はシステムのリブートを推奨します。

一時的な負荷により、ハングアップまたはI/Oエラーを検出した場合は、以下のようにセルフチェック機能を再起動することで復旧できます。

# /opt/FJSVhanet/etc/sbin/hanetmond

セルフチェック機能の再起動に失敗した場合は、調査資料を採取し、当社技術員(SE)にエラーメッセージをお知らせください。

なお、セルフチェック機能の再起動に失敗した場合、システムのリソース不足や異常が発生している可能性があります。それらを解消するために、システムをリブートしてください。