ページの先頭行へ戻る
PRIMECLUSTER  導入運用手引書 4.3

5.1.2 シャットダウン機構の設定

ここでは、PRIMERGY/PRIMEQUEST/仮想マシン環境のシャットダウン機構の設定手順について説明します。

シャットダウン機構の設定手順は、機種/構成により異なります。ハードウェアの機種/構成を確認して適切なシャットダウンエージェントを設定してください。

以下に機種/構成により必要なシャットダウンエージェントを示します。

表5.2 PRIMERGYで必要なシャットダウンエージェント

サーバ機種

SA_lkcd

SA_ipmi

SA_blade

BX620/920/960 シリーズ

△(*1)(*2)

RX200/300/500/600 シリーズ

×

TX200/300 シリーズ

×

(*1)BX620/920/960 シリーズでServerView Resource Orchestrator Virtual Editionと組み合わせて利用する場合、SA_ipmiを設定してください。

(*2)全ブレードにおいて、BMCまたはiRMCのユーザ名とパスワードは同一にしてください。

表5.3 PRIMEQUESTで必要なシャットダウンエージェント

サーバ機種

MMB

Panic

Reset

PRIMEQUEST

1000シリーズ

SA_mmbp

SA_mmbr

表5.4 仮想マシン環境で必要なシャットダウンエージェント(Xen環境)

サーバ機種

クラスタ構成

仮想マシン機能(Xen環境)

筐体内ゲスト間

他筐体ゲスト間

vmSP

Panic

Reset

Panic

Reset

PRIMEQUEST

1000シリーズ

SA_vmSPgp

SA_vmSPgr

SA_vmSPgp

SA_vmSPgr

表5.5 仮想マシン環境で必要なシャットダウンエージェント(KVM環境)

サーバ機種

クラスタ構成

仮想マシン機能(KVM環境)

筐体内ゲスト間

他筐体ゲスト間

libvirt

Panic

Reset

Panic

Reset

PRIMERGY

SA_libvirtgp

SA_libvirtgr

SA_libvirtgp

SA_libvirtgr

PRIMEQUEST

1000シリーズ

SA_libvirtgp

SA_libvirtgr

SA_libvirtgp

SA_libvirtgr

なお、管理OS異常切替機能を使用する場合には、以下のシャットダウンエージェントを設定します。ゲストOS上に設定するシャットダウンエージェントのSA_vmSPgp、SA_vmSPgr、SA_libvirtgp、SA_libvirtgrについては、仮想マシン機能で使用していたものと同様です。SA_vmSPgp、SA_vmSPgr、SA_libvirtgp、SA_libvirtgrの詳細は、“5.1.2.5.1 vmSP(VM用クラスタ連携ツール)”、“5.1.2.5.2 libvirt”を参照してください。SA_vmchkhostについては、“5.1.2.5.3 vmchkhost”の設定手順に従い設定を行ってください。

表5.6 管理OS異常切替機能で必要なシャットダウンエージェント(Xen環境)

サーバ機種

クラスタ構成

仮想マシン機能(Xen環境)

他筐体ゲスト間(管理OS異常切替機能使用)

MMB

vmSP

vmchkhost

Panic

Reset

Panic

Reset

状態確認

PRIMEQUEST 1000シリーズ

管理OS

SA_mmbp

SA_mmbr

ゲストOS

SA_vmSPgp

SA_vmSPgr

SA_vmchkhost

表5.7 管理OS異常切替機能で必要なシャットダウンエージェント(KVM環境)

サーバ機種

クラスタ構成

仮想マシン機能(KVM環境)

他筐体ゲスト間(管理OS異常切替機能使用)

サーバ機種に依存

libvirt

vmchkhost

Panic

Reset

状態確認

PRIMERGY

管理OS

表5.2参照

ゲストOS

SA_libvirtgp

SA_libvirtgr

SA_vmchkhost

PRIMEQUEST 1000シリーズ

管理OS

表5.3参照

ゲストOS

SA_libvirtgp

SA_libvirtgr

SA_vmchkhost

注意

シャットダウン機構に使用する管理LANをGLSで二重化する場合は、NIC切替方式の論理IPアドレス引継ぎ機能を使用し、シャットダウン機構の管理LANには物理IPアドレスを設定してください。

参照

シャットダウン機構についての詳細は、以下のマニュアルを参照してください。

  1. “PRIMECLUSTER コンセプトガイド”の“3.3.1.7 PRIMECLUSTER SF”

  2. “PRIMECLUSTER Cluster Foundation 導入運用手引書”の“8 シャットダウン機構(SF)”

5.1.2.1 シャットダウンエージェントの情報確認

使用するシャットダウンエージェントについて、情報を確認します。

注意

シャットダウンエージェントの情報確認は、クラスタの初期設定前に実施してください。

MMBの確認

MMBを使用している場合は、以下の設定を確認してください。

RMCPでMMBを制御するためのユーザの設定を確認するには、MMB Web-UIにログインし、“Network Configuration”メニューの“Remote Server Management”画面から確認します。

上記のとおりに設定されていない場合は、上記のようにMMBを設定してください。

また、MMBに関する以下の情報をメモしてください。

注意

MMBには以下の2種類のユーザが存在します。

  • MMB全体を制御するためのユーザ

  • RMCPでMMBを制御するためのユーザ

ここで確認するユーザはRMCPでMMBを制御するためのユーザです。誤らないようにしてください。

参照

MMBの設定方法、確認方法については、“PRIMEQUEST 1000 シリーズ 運用管理ツールリファレンス”を参照してください。

■仮想マシンの確認(Xen環境の場合)

Xen環境でvmSP(VM用クラスタ連携ツール)をシャットダウン機構に設定する場合、ゲストOSを強制停止するために、SSH で管理OSにログインします。そのため、以下の情報を設定する必要があります。

管理OSにログインするためのユーザ名とパスワードについては、“3.2.1.1 管理OSの設定”で設定した情報をメモしてください。

仮想マシンの確認(KVM環境の場合)

KVM環境でシャットダウン機構を設定する場合、ゲストOSを強制停止するために、SSH でハイパーバイザーにログインします。そのため、以下の情報を設定する必要があります。

ハイパーバイザーにログインするためのユーザ名とパスワードについては、“3.2.1.1 管理OSの設定”で設定した情報をメモしてください。

5.1.2.2 生存優先度

クラスタインタコネクトの障害によりクラスタパーティションが発生した場合、まだ全ノードがユーザ資産にアクセスできる状態にあります。クラスタパーティションについては、“PRIMECLUSTER コンセプトガイド”の“2.2.2.1 データ整合性の保証”を参照してください。
ユーザ資産であるデータの整合性を保証するために、生存させるノード群と強制停止させるノード群を決定する必要があります。
PRIMECLUSTERでは、それぞれのノード群に対する重み付けを「生存優先度」と呼んでいます。
ノードの重みが大きいほど生存優先度は高くなり、小さくなるにつれて生存優先度は低くなります。ノード群の生存優先度が同じ場合は、ノード名がアルファベット順で最も早いノードを含むノード群が生存します。

生存優先度は、以下の計算で求められます。

生存優先度=SFのノードの重み(weight)+userApplicationの ShutdownPriority
SFのノードの重み(weight):

ノードの重み。デフォルト値=1。シャットダウン機能の設定の際に指定します。

userApplicationのShutdownPriority:

設定はuserApplication作成時の属性設定で行ってください。設定値の変更方法については、“8.5 userApplicationの運用属性の変更”を参照してください。

参照

userApplicationのShutdownPriority属性については、“PRIMECLUSTER RMS 導入運用手引書”の“11.1 ユーザ設定属性”を参照してください。

◆生存優先度の設計指針

以下に、代表的なケースをもとに、生存優先度の設計指針を示します。

[最も多くのノードを生存させたい場合]
  • 全てのノードのweightを1(デフォルト)に設定

  • 全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定

[特定のノードを生存させたい場合]
  • 生存させるノードのweightをその他ノードのweightの合計の2倍以上の値に設定

  • 全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定

以下は、node1を生存させる場合の例です。

[特定のアプリケーションが動作しているノードを生存させたい場合]
  • 全てのノードのweightを1(デフォルト)に設定

  • 動作を続けさせるユーザアプリケーションのShutdownPriority属性をその他のユーザアプリケーションのShutdownPriority属性と全てのノードのweightの合計の2倍以上の値に設定

以下は、app1が動作しているノードを生存させる場合の例です。

[特定の順番でノードを生存させたい場合]
  • 生存させるノードのweightを自分より優先度が低いノードのweightの合計の2倍以上の値に設定

  • 全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定

以下は、node1、node2、node3、node4の順番でノードを生存させる場合の例です。

[管理OS異常切替機能を使用する場合]
  • 各クラスタシステムにおいて、生存優先度の低い順に、ノードのweightを2のべき乗(1,2,4,8,16,...)の値に設定

  • ゲストOSに設定するweightは、対応する管理OSと順序関係が同じになるようにする

    例えば、管理OS間でhost1の生存優先度をhost2より高くするとき、ゲストOS間でnode1(host1に対応)の生存優先度をnode2~4(host2に対応)より高く設定

  • 全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定

以下は、node1、node2、node3、node4の順番でノードを生存させる場合の例です。

5.1.2.3 PRIMERGYでのシャットダウンエージェントの設定

PRIMERGYでシャットダウンエージェントを設定する手順について説明します。仮想マシン環境で使用する場合は、“5.1.2.5 仮想マシン環境でのシャットダウンエージェントの設定”を参照してください。

注意

シャットダウンエージェント設定後は、正しいノードが強制停止できることを確認するため、クラスタノード強制停止テストを実施してください。クラスタノード強制停止テストの詳細については、“1.4 テスト”を参照してください。

5.1.2.3.1 シャットダウンデーモンの設定

全ノードで/etc/opt/SMAW/SMAWsf/rcsd.cfgを以下のような内容で作成します。

CFNameX,weight=weight,admIP=myadmIP: agent=SA_xxx,timeout=20
CFNameX,weight=weight,admIP=myadmIP: agent=SA_xxx,timeout=20
CFNameX : クラスタホストのCFノード名を指定します。
weight  : SFのノードの重みを指定します。
myadmIP : 自ノードの管理LANのIPアドレスを指定します。
SA_xxx  : シャットダウンエージェントの名前を指定します。
            - IPMIシャットダウンエージェントの場合
              SA_ipmiを指定します。
            - Bladeシャットダウンエージェントの場合
              SA_bladeを指定します。

例)IPMIシャットダウンエージェントの場合

node1, weight=1, admIP=10.20.30.100: agent=SA_ipmi, timeout=25
node2, weight=1, admIP=10.20.30.101: agent=SA_ipmi, timeout=25

例)Bladeシャットダウンエージェントの場合

node1, weight=1, admIP=10.20.30.100: agent=SA_blade, timeout=20
node2, weight=1, admIP=10.20.30.101: agent=SA_blade, timeout=20

注意

  • IPMIシャットダウンエージェントの場合、timeoutには“25”を指定します。

  • PRIMERGY でSTP(スパニングツリープロトコル)を使用する場合には、STPがツリーを作成する時間と余裕を考慮し、SFのタイムアウト値を、現在設定されている値+50(秒)にする必要があります。この設定により、フェイルオーバに要する時間も遅くなります。

参考

/etc/opt/SMAW/SMAWsf/rcsd.cfgファイルを作成する場合、/etc/opt/SMAW/SMAWsf/rcsd.cfg.templateファイルを雛型として使用することができます。

5.1.2.3.2 IPMI

BMC(Baseboard Management Controller)、またはiRMC(integrated Remote Management Controller)が搭載されているサーバの場合、IPMIシャットダウンエージェントを設定してください。

IPMIシャットダウンエージェントの設定は、kdumpシャットダウンエージェントの設定前に行ってください。

全ノードで/etc/opt/SMAW/SMAWsf/SA_ipmi.cfgを以下のような内容で作成します。

CFName1  ip-address:user:passwd {cycle | leave-off}
CFName2  ip-address:user:passwd {cycle | leave-off}
CFNameX      : クラスタホストのCFノード名
ip-address   : IPMI(BMC, iRMC)のIPアドレス
user         : IPMI(BMC, iRMC)設定時に定義したユーザ名
passwd       : IPMI(BMC, iRMC)設定時に定義したパスワード
                パスワードには、英数字と以下の記号が使用できます。
                  # % * + - . @ [ ] ^ _ { } ~
cycle        : ノード強制停止後、リブートします。
leave-off    : ノード強制停止後、電源切断します。

例)

node1のiRMCのIPアドレスが10.20.30.50、node2のiRMCのIPアドレスが10.20.30.51の場合

node1  10.20.30.50:root:bmcpwd cycle
node2 10.20.30.51:root:bmcpwd cycle

参考

/etc/opt/SMAW/SMAWsf/SA_ipmi.cfgファイルを作成する場合、/etc/opt/SMAW/SMAWsf/SA_ipmi.cfg.templateファイルを雛形として使用することができます。

注意

  • /etc/opt/SMAW/SMAWsf/SA_ipmi.cfgファイルの設定内容が正しいか確認してください。設定内容に誤りがあった場合、シャットダウン機構が正常に動作できなくなります。

  • /etc/opt/SMAW/SMAWsf/SA_ipmi.cfgファイルのクラスタホストのCFノード名(CFNameX)に対応した、IPMI(BMC, iRMC)のIPアドレス(ip-address)が設定されているか確認してください。設定に誤りがあった場合、誤ったノードが強制停止されることがあります。

  • IPMI(BMC, iRMC)設定時に定義したパスワードに記号を使用した場合、記号の前にエスケープ文字を意味する'\'の追加は不要です。

    例) IPMI(BMC, iRMC)設定時に定義したパスワードが"bmcpwd#"の場合

    node1 10.20.30.50:root:bmcpwd# cycle
    node2 10.20.30.51:root:bmcpwd# cycle
  • /etc/opt/SMAW/SMAWsf/SA_ipmi.cfgファイルのパーミッションを、以下のコマンドを実行して600に変更してください。

    # chmod 600 /etc/opt/SMAW/SMAWsf/SA_ipmi.cfg
5.1.2.3.3 Blade

ブレードサーバの場合、Bladeシャットダウンエージェントを設定してください。
Bladeシャットダウンエージェントの設定は、kdumpシャットダウンエージェントの設定前に行ってください。

全ノードで/etc/opt/SMAW/SMAWsf/SA_blade.cfgを以下のような内容で作成します。

(1) 同一シャーシ内のクラスタ構成の場合

management-blade-ip IPaddress 
community-string SNMPcommunity
CFName1 slot-no {cycle | leave-off}
CFName2 slot-no
{cycle | leave-off}

(2) 複数シャーシのクラスタ構成の場合

community-string SNMPcommunity
management-blade-ip IPaddress 
CFName1 slot-no {cycle | leave-off}
management-blade-ip IPaddress
CFName2 slot-no
{cycle | leave-off}
IPaddress      : マネージメントブレードのIPアドレス
SNMPcommunity  : SNMP コミュニティ
CFNameX        : クラスタホストのCFノード名
slot-no        : サーバブレードのスロット番号
cycle          : ノード強制停止後、リブートします。
leave-off      : ノード強制停止後、電源切断します。

例1)

node1とnode2のマネージメントブレードのIPアドレスが10.20.30.50、node1のスロット番号が1、node2のスロット番号が2の場合

management-blade-ip 10.20.30.50
community-string public
node1 1 cycle
node2 2 cycle

例2)

node1のマネージメントブレードのIPアドレスが10.20.30.50でスロット番号が1、node2のマネージメントブレードのIPアドレスが10.20.30.51でスロット番号が2の場合

community-string public
management-blade-ip  10.20.30.50
node1 1 cycle
management-blade-ip  10.20.30.51
node2 2 cycle

参考

/etc/opt/SMAW/SMAWsf/SA_blade.cfgを作成する場合、/etc/opt/SMAW/SMAWsf/SA_blade.cfg.templateファイルを雛型として使用することができます。

注意

  • /etc/opt/SMAW/SMAWsf/SA_blade.cfgファイルの設定内容が正しいか確認してください。設定内容に誤りがあった場合、シャットダウン機構が正常に動作できなくなります。

  • /etc/opt/SMAW/SMAWsf/SA_blade.cfgファイルのクラスタホストのCFノード名(CFNameX)に対応した、マネージメントブレードのIPアドレス(IPaddress)とサーバブレードのスロット番号(slot-no)が設定されているか確認してください。設定に誤りがあった場合、誤ったノードが強制停止されることがあります。

  • /etc/opt/SMAW/SMAWsf/SA_blade.cfgファイルのパーミッションを、以下のコマンドを実行して600に変更してください。

    # chmod 600 /etc/opt/SMAW/SMAWsf/SA_blade.cfg

注意

rcsd.cfg, SA_ipmi.cfg, SA_blade.cfgファイルの内容は全ノードで同一にしてください。同一でない場合、誤動作することがあります。

5.1.2.3.4 kdump

クラッシュダンプの採取にkdumpを使用する場合、kdumpシャットダウンエージェントの設定を行ってください。

5.1.2.3.5 シャットダウン機構の起動

全ノードでシャットダウン機構を起動または再起動させます。

シャットダウンデーモン(rcsd)が動作中かどうかはsdtool -sで確認できます。

# sdtool -s

全ノードでsdtool -sを実行することで、シャットダウン機構の構成状態を確認することができます。

注意

sdtool -s コマンドの表示結果で、シャットダウン機構が正常に動作していることを確認してください。
シャットダウン機構の設定が完了しているのに、初期状態がInitFailedと表示されたり、テスト状態にUnknownやTestFailedと表示されたりする場合、エージェントやハードウェアの構成設定に誤りがある可能性があります。/var/log/messages ファイルにエラーメッセージが出力されていないかを確認してください。その後、出力されたメッセージの内容に応じた対処を実施してください。

5.1.2.4 PRIMEQUESTでのシャットダウンエージェントの設定

PRIMEQUESTでシャットダウンエージェントを設定する手順について説明します。仮想マシン環境で使用する場合は、“5.1.2.5 仮想マシン環境でのシャットダウンエージェントの設定”を参照してください。

注意

シャットダウンエージェント設定後は、正しいノードが強制停止できることを確認するため、クラスタノード強制停止テストを実施してください。クラスタノード強制停止テストの詳細については、“1.4 テスト”を参照してください。

5.1.2.4.1 MMB

ここでは、MMBをシャットダウン機構に設定する手順について説明します。

シャットダウン機構を設定する前にシャットダウンエージェントの情報確認を行ってください。

MMBシャットダウン機構設定

■ MMB情報の登録

注意

ここで説明するMMB情報の登録は、“5.1.1 CF、CIPの設定”の後、また、後述の“■シャットダウンデーモンの設定”の前に実施してください。

  1. 全ノードでclmmbsetup -a コマンドを実行し、MMB情報を登録します。

    clmmbsetupコマンドの使用法については、clmmbsetupのマニュアルページを参照してください。

    # /etc/opt/FJSVcluster/bin/clmmbsetup -a mmb-user
    Enter User's Password:
    Re-enter User's Password:

    mmb-userUser's Passwordには、“5.1.2.1 シャットダウンエージェントの情報確認”で確認した以下の内容を入力します。

    mmb-user

    RMCPでMMBを制御するためのユーザ名

    User's Password

    RMCPでMMBを制御するためのユーザのパスワード

    注意

    ユーザのパスワードに使用可能な文字は英数字のみです。記号は使用できません。

  2. 全ノードでclmmbsetup -l コマンドを実行し、登録されたMMB情報を確認します。

    手順1.で登録したMMB情報が全ノードで出力されない場合、再度手順1.からやり直してください。

    # /etc/opt/FJSVcluster/bin/clmmbsetup -l
    cluster-host-name  user-name
    -----------------------------------
    node1              mmb-user
    node2              mmb-user
■ シャットダウンデーモンの設定

全ノードで/etc/opt/SMAW/SMAWsf/rcsd.cfgを以下のような内容で作成します。

CFNameX,weight=weight,admIP=myadmIP: agent=SA_xxx,timeout=20
CFNameX,weight=weight,admIP=myadmIP: agent=SA_xxx,timeout=20
CFNameX  : クラスタホストのCFノード名を指定します。
weight   : SFのノードの重みを指定します。
myadmIP  : 自ノードの管理LANのIPアドレスを指定します。
SA_xxx   : シャットダウンエージェントの名前を指定します。
             - MMB経由でノードをパニックさせる場合
               SA_mmbp を指定します。
             - MMB経由でノードをリセットさせる場合
               SA_mmbr を指定します。

例)2ノード構成の設定例を以下に記載します。

# cat /etc/opt/SMAW/SMAWsf/rcsd.cfg
node1,weight=2,admIP=fuji2:agent=SA_mmbp,timeout=20:agent=SA_mmbr,timeout=20
node2,weight=2,admIP=fuji3:agent=SA_mmbp,timeout=20:agent=SA_mmbr,timeout=20

注意

  • rcsd.cfgファイルで設定するシャットダウンエージェントは、SA_mmbp、SA_mmbrの順番で両方のシャットダウンエージェントを設定してください。

  • rcsd.cfgファイルの内容は全ノードで同一にしてください。同一でない場合、誤動作することがあります。

参考

/etc/opt/SMAW/SMAWsf/rcsd.cfgファイルを作成する場合、/etc/opt/SMAW/SMAWsf/rcsd.cfg.mmb.templateファイルを雛型として使用することができます。

■ MMB非同期監視デーモンの起動
  1. MMB非同期監視デーモンの起動

    全ノードでMMB非同期監視デーモンが起動済か確認してください。

    # /etc/opt/FJSVcluster/bin/clmmbmonctl

    “The devmmbd daemon exists.”が表示された場合、MMB非同期監視デーモンは起動済です。

    “The devmmbd daemon does not exist.”が表示された場合、MMB非同期監視デーモンは起動していません。以下を実行し、MMB非同期監視デーモンを起動してください。

    # /etc/opt/FJSVcluster/bin/clmmbmonctl start
  2. シャットダウン機構の起動

    全ノードでシャットダウン機構が起動済か確認してください。

    # sdtool -s

    シャットダウン機構が起動済の場合、以下を実行して全ノードでシャットダウン機構を再起動してください。

    # sdtool -e
    # sdtool -b

    シャットダウン機構が起動していない場合、以下を実行して全ノードでシャットダウン機構を起動してください。

    # sdtool -b
  3. シャットダウン機構の状態確認

    全ノードでシャットダウン機構の状態を確認してください。

    # sdtool -s

参考

sdtool -s コマンドの表示結果について
  • 初期状態がInitFailed と表示された場合は、そのシャットダウンエージェントの初期化で問題が発生したことを示しています。

  • テスト状態にTestFailed と表示された場合は、クラスタホスト欄に表示されたノードを停止できるかどうかをエージェントがテストしている間に問題が発生したことを示しています。 このような場合には、そのエージェントが使用しているソフトウェア、ハードウェア、ネットワーク資源に何らかの問題が生じていることが考えられます。

  • 停止状態または初期状態にUnknown と表示された場合は、SF がノードの停止、経路のテスト、SA の初期化をまだ行っていないことを表しています。 テスト状態および初期状態には、実際の状態が確認されるまで一時的にUnknown が表示されます。

  • TestFailed またはInitFailed が表示された場合は、SA ログファイルまたは、/var/log/messages を確認してください。ログファイルには、SA のテストまたは初期化に失敗した理由が記録されています。失敗した問題が解決されSF が再起動されると、状態の表示がInitWorked またはTestWorked に変わります。

注意

  • OS起動直後に“sdtool -s”を実行すると、自ノードのテスト状態にTestFailedと表示される場合がありますが、これはsnmptrapdデーモンが起動中のため表示されるもので、正しい動作です。シャットダウン機構が起動した10分後に“sdtool -s”を実行すると、テスト状態にTestWorkedが表示されます。

    以下の例では、自ノード(node1)のテスト状態にTestFailedが表示されています。

    # sdtool -s
    Cluster Host    Agent         SA State      Shut State  Test State  Init State
    ------------    -----         --------      ----------  ----------  ----------
    node1           SA_mmbp.so    Idle          Unknown     TestFailed  InitWorked
    node1           SA_mmbr.so    Idle          Unknown     TestFailed  InitWorked
    node2           SA_mmbp.so    Idle          Unknown     TestWorked  InitWorked
    node2           SA_mmbr.so    Idle          Unknown     TestWorked  InitWorked

    また、同じ理由により、OS起動直後に以下のメッセージが出力される場合があります。

    3084: Monitoring another node has been stopped.
    SA SA_mmbp.so to test host nodename failed
    SA SA_mmbr.so to test host nodename failed

    これも、snmptrapdデーモンが起動中のため出力されるもので、正しい動作です。シャットダウン機構が起動した10分後に以下のメッセージが出力されます。

    3083: Monitoring another node has been started.
  • SA_mmbr シャットダウンエージェントによるノードの強制停止を行うと、以下のメッセージが出力される場合がありますが、これはノードの強制停止に時間がかかっているもので、正しい動作です。

    Fork SA_mmbp.so(PID pid) to shutdown host nodename
            :
    SA SA_mmbp.so to shutdown host nodename failed
            :
    Fork SA_mmbr.so(PID pid) to shutdown host nodename
            :
    SA SA_mmbr.so to shutdown host nodename failed
            :
    MA SA_mmbp.so reported host nodename leftcluster, state MA_paniced_fsnotflushed
            :
    MA SA_mmbr.so reported host nodename leftcluster, state MA_paniced_fsnotflushed
            :
    Fork SA_mmbp.so(PID pid) to shutdown host nodename
            :
    SA SA_mmbp.so to shutdown host nodename succeeded

    上記メッセージが出力された後に“sdtool -s”を実行すると、SA_mmbp.so の停止状態に KillWorked が表示され、SA_mmbr.so の停止状態に KillFailed が表示されます。

    以下は、node1 から node2 の強制停止を行い、上記メッセージが出力された後に“sdtool -s”を実行した場合の表示例です。

    # sdtool -s
    Cluster Host    Agent         SA State      Shut State  Test State  Init State
    ------------    -----         --------      ----------  ----------  ----------
    node1           SA_mmbp.so    Idle          Unknown     TestWorked  InitWorked
    node1           SA_mmbr.so    Idle          Unknown     TestWorked  InitWorked
    node2           SA_mmbp.so    Idle          KillWorked  TestWorked  InitWorked
    node2           SA_mmbr.so    Idle          KillFailed  TestWorked  InitWorked

    “sdtool -s”で表示された KillFailed を復旧する場合は、以下の手順で復旧してください。

    # sdtool -e
    # sdtool -b
    # sdtool -s
    Cluster Host    Agent         SA State      Shut State  Test State  Init State
    ------------    -----         --------      ----------  ----------  ----------
    node1           SA_mmbp.so    Idle          Unknown     TestWorked  InitWorked
    node1           SA_mmbr.so    Idle          Unknown     TestWorked  InitWorked
    node2           SA_mmbp.so    Idle          Unknown     TestWorked  InitWorked
    node2           SA_mmbr.so    Idle          Unknown     TestWorked  InitWorked

I/O完了待ち時間の設定

パニックなどのノードダウンによる切替え時、I/Oが完了するまでの待ち時間 (WaitForIOComp)の設定は、以下の手順で実施してください。

  1. 共用ディスクの事前確認

    MMB非同期監視のパニックなどのノードダウンによる切替え時のI/O完了待ち時間は標準で0秒を設定していますが、I/O完了待ち時間が必要な共用ディスクを使用する場合、この値を適切な値に設定する必要があります。

    参考

    弊社製RAID装置は全てI/O完了待ち時間が不要です。そのため、本設定を行う必要はありません。

    注意

    I/O完了待ち時間を設定した場合、パニックなどのノードダウン時の切替え時間がその時間分増加します。

  2. I/O完了待ち時間の設定

    以下のコマンドを実行し、パニックなどのノードダウンによる切替え時のI/Oが完了するまでの待ち時間(WaitForIOComp)を設定してください。cldevparamコマンドについて、詳しくはcldevparamのマニュアルページを参照してください。

    なお、クラスタシステムを構成する任意の1ノードで実行してください。

    # /etc/opt/FJSVcluster/bin/cldevparam -p WaitForIOComp value

    また、以下のコマンドを実行し、I/Oが完了するまでの待ち時間(WaitForIOComp)の設定を確認してください。

    # /etc/opt/FJSVcluster/bin/cldevparam -p WaitForIOComp
     value
  3. シャットダウン機構の起動

    全ノードでシャットダウン機構が起動済か確認してください。

    # sdtool -s

    シャットダウン機構が起動済の場合、以下を実行して全ノードでシャットダウン機構を再起動してください。

    # sdtool -r

    シャットダウン機構が起動していない場合、以下を実行して全ノードでシャットダウン機構を起動してください。

    # sdtool -b
  4. シャットダウン機構の状態確認

    全ノードでシャットダウン機構の状態を確認してください。

    # sdtool -s

5.1.2.5 仮想マシン環境でのシャットダウンエージェントの設定

仮想マシン環境でシャットダウンエージェントを設定する手順について説明します。

注意

シャットダウンエージェント設定後は、正しいノードが強制停止できることを確認するため、クラスタノード強制停止テストを実施してください。クラスタノード強制停止テストの詳細については、“1.4 テスト”を参照してください。

5.1.2.5.1 vmSP(VM用クラスタ連携ツール)

ここでは、Xen環境でvmSP(VM用クラスタ連携ツール)をシャットダウン機構に設定する手順について説明します。

シャットダウン機構を設定する前に“5.1.2.1 シャットダウンエージェントの情報確認”を行ってください。

注意

下記の1.から6.までの操作はすべてのゲストOS(ノード)で実行してください。

  1. パスワードの暗号化

    sfcipher コマンドを実行し、クラスタノードとして設定したゲストOSが存在する、すべての管理OSのアカウントFJSVvmSPのパスワードを暗号化します。
    sfcipher コマンドの使用法については、sfcipherのマニュアルページを参照してください。

    # sfcipher -c
    Enter User's Password:
    Re-enter User's Password:
    D0860AB04E1B8FA3
  2. シャットダウンエージェントの設定

    シャットダウンエージェントを設定してください。PANIC用シャットダウンエージェント(SA_vmSPgp)の場合は/etc/opt/SMAW/SMAWsf/SA_vmSPgp.cfg、RESET用シャットダウンエージェント(SA_vmSPgr)の場合は/etc/opt/SMAW/SMAWsf/SA_vmSPgr.cfgをそれぞれ以下のような内容で作成します。

    CFNameX domainX ip-address user passwd
    CFNameX domainX ip-address user passwd
    CFNameX    : クラスタホストのCFノード名を指定します。
    domainX    : ゲストOSのドメイン名を指定します。
    ip-address : 管理OSのIPアドレスを指定します。
    user       : 管理OSのアカウントFJSVvmSPを指定します。
    passwd     : 管理OSのアカウントFJSVvmSPのログインパスワードです。
                 1.のパスワードの暗号化で暗号化したものを指定します。

    例)設定例を以下に示します。

    node1のゲストOSのドメイン名がdomain1で、node1が動作する管理OSのIPアドレスが10.20.30.50、node2のゲストOSのドメイン名がdomain2で、node2が動作する管理OSのIPアドレスが10.20.30.51の場合

    # cat /etc/opt/SMAW/SMAWsf/SA_vmSPgp.cfg
    node1 domain1 10.20.30.50 FJSVvmSP D0860AB04E1B8FA3
    node2 domain2 10.20.30.51 FJSVvmSP D0860AB04E1B8FA3
    # cat /etc/opt/SMAW/SMAWsf/SA_vmSPgr.cfg
    node1 domain1 10.20.30.50 FJSVvmSP D0860AB04E1B8FA3
    node2 domain2 10.20.30.51 FJSVvmSP D0860AB04E1B8FA3

    注意

    • /etc/opt/SMAW/SMAWsf/SA_vmSPgp.cfgファイルと/etc/opt/SMAW/SMAWsf/SA_vmSPgr.cfgファイルの設定内容が正しいか確認してください。設定内容に誤りがあった場合、シャットダウン機構が正常に動作できなくなります。

    • /etc/opt/SMAW/SMAWsf/SA_vmSPgp.cfgファイルと/etc/opt/SMAW/SMAWsf/SA_vmSPgr.cfgファイルのクラスタホストのCFノード名(CFNameX)に対応した、ゲストOSのドメイン名(domainX)と管理OSのIPアドレス(ip-address)が設定されているか確認してください。設定に誤りがあった場合、誤ったノードが強制停止されることがあります。

  3. 管理OSへのログイン

    シャットダウン機構は、対象ノードへSSHでアクセスするため、SSH初回時のユーザ問い合わせ(RSA 鍵の生成)を済ませておく必要があります。
    全ゲストOS(ノード)上でそれぞれ、2. で設定したすべての管理OS のIP アドレス (ip-address) に対して、2. で設定した管理OSのユーザ名 (user) でログインを実行してください。

    # ssh -l FJSVvmSP XXX.XXX.XXX.XXX
    The authenticity of host 'XXX.XXX.XXX.XXX (XXX.XXX.XXX.XXX)' can't be established.
    RSA key fingerprint is xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx.
    Are you sure you want to continue connecting (yes/no)? yes ←yes と入力
  4. シャットダウンデーモンの設定

    /etc/opt/SMAW/SMAWsf/rcsd.cfgを以下のような内容で作成します。

    CFNameX,weight=weight,admIP=myadmIP:agent=SA_xxxx,timeout=35
    CFNameX,weight=weight,admIP=myadmIP:agent=SA_xxxx,timeout=35
    CFNameX       :クラスタホストのCFノード名を指定します。
    weight        :SFのノードの重みを指定します。
    myadmIP       :自ゲストOS(ノード)の管理LANのIPアドレスを指定します。
    SA_xxxx       :シャットダウンエージェントの名前を指定します。
                    ここでは、“SA_vmSPgp”または” SA_vmSPgr”を指定します。

    例)設定例を以下に示します。

    # cat /etc/opt/SMAW/SMAWsf/rcsd.cfg
    node1,weight=2,admIP=fuji2:agent=SA_vmSPgp,timeout=35:agent=SA_vmSPgr,timeout=35
    node2,weight=2,admIP=fuji3:agent=SA_vmSPgp,timeout=35:agent=SA_vmSPgr,timeout=35

    注意

    • rcsd.cfgファイルで設定するシャットダウンエージェントは、SA_vmSPgp、SA_vmSPgrの順番で両方のシャットダウンエージェントを設定してください。

    • SA_vmSPgp.cfg、SA_vmSPgr.cfg、rcsd.cfgファイルの内容はすべてのゲストOS(ノード)で同一にしてください。同一でない場合誤動作します。

  5. シャットダウン機構の起動

    全ノードでシャットダウン機構が起動済か確認してください。

    # sdtool -s

    シャットダウン機構が起動済の場合、以下を実行して全ノードでシャットダウン機構を再起動してください。

    # sdtool -e
    # sdtool -b

    シャットダウン機構が起動していない場合、以下を実行して全ノードでシャットダウン機構を起動してください。

    # sdtool -b
  6. シャットダウン機構の状態確認

    シャットダウン機構の状態を確認してください。

    # sdtool -s

参考

sdtool -s コマンドの表示結果について

  • 初期状態がInitFailed と表示された場合は、そのシャットダウンエージェントの初期化で問題が発生したことを示しています。

  • テスト状態にTestFailed と表示された場合は、クラスタホスト欄に表示されたノードを停止できるかどうかをエージェントがテストしている間に問題が発生したことを示しています。このような場合には、そのエージェントが使用しているソフトウェア、ハードウェア、ネットワーク資源、管理OSに何らかの問題が生じていることが考えられます。

  • SSHの最大同時接続数が"クラスタ構成ノード数"以下の場合、シャットダウン機構の状態が InitFailed または TestFailed で表示されることがあります。SSHの最大同時接続数が"クラスタ構成ノード数+1"以上となるように設定を変更してください。

  • 停止状態または初期状態にUnknown と表示された場合は、SF がノードの停止、経路のテスト、SA の初期化をまだ行っていないことを表しています。テスト状態および初期状態には、実際の状態が確認されるまで一時的にUnknown が表示されます。

  • TestFailed またはInitFailed が表示された場合は、SA ログファイルまたは、/var/log/messages を確認してください。ログファイルには、SA のテストまたは初期化に失敗した理由が記録されています。失敗した問題が解決されSF が再起動されると、状態の表示がInitWorked またはTestWorked に変わります。

5.1.2.5.2 libvirt

ここでは、KVM環境でlibvirtをシャットダウン機構に設定する手順について説明します。

シャットダウン機構を設定する前に“5.1.2.1 シャットダウンエージェントの情報確認”を行ってください。

注意

下記の1.から6.までの操作はすべてのゲストOS(ノード)で実行してください。

  1. パスワードの暗号化

    sfcipherコマンドを実行し、シャットダウン機構用のユーザのパスワードを暗号化します。

    sfcipherコマンドの使用法については、sfcipherのマニュアルページを参照してください。

    # sfcipher -c
    Enter User's Password:
    Re-enter User's Password:
    D0860AB04E1B8FA3
  2. シャットダウンエージェントの設定

    シャットダウンエージェントを設定してください。PANIC用シャットダウンエージェント(SA_libvirtgp)の場合は/etc/opt/SMAW/SMAWsf/SA_libvirtgp.cfg 、RESET 用シャットダウンエージェント(SA_libvirtgr) の場合は/etc/opt/SMAW/SMAWsf/SA_libvirtgr.cfgをそれぞれ以下のような内容で作成します。

    CFNameX domainX ip-address user passwd
    CFNameX domainX ip-address user passwd
    CFNameX       :クラスタホストのCFノード名を指定します。
    domainX       :ゲストOSのドメイン名を指定します。
    ip-address    :ハイパーバイザーのIPアドレスを指定します。
    user           :ハイパーバイザーのアカウントです。シャットダウン機構用のユーザを指定します。
    passwd         :“user”で指定したアカウントのログインパスワードです。
                    1.のパスワードの暗号化で確認したものを指定します。

    例)設定例を以下に示します。

    node1のゲストOSのドメイン名がdomain1で、node1が動作するハイパーバイザーのIPアドレスが10.20.30.50、node2のゲストOSのドメイン名がdomain2で、node2が動作するハイパーバイザーのIPアドレスが10.20.30.51の場合

    # cat /etc/opt/SMAW/SMAWsf/SA_libvirtgp.cfg
    node1 domain1 10.20.30.50 user D0860AB04E1B8FA3
    node2 domain2 10.20.30.51 user D0860AB04E1B8FA3
    # cat /etc/opt/SMAW/SMAWsf/SA_libvirtgr.cfg
    node1 domain1 10.20.30.50 user D0860AB04E1B8FA3
    node2 domain2 10.20.30.51 user D0860AB04E1B8FA3

    注意

    • /etc/opt/SMAW/SMAWsf/SA_libvirtgp.cfgファイルと/etc/opt/SMAW/SMAWsf/SA_libvirtgr.cfgファイルの設定内容が正しいか確認してください。設定内容に誤りがあった場合、シャットダウン機構が正常に動作できなくなります。

    • /etc/opt/SMAW/SMAWsf/SA_libvirtgp.cfgファイルと/etc/opt/SMAW/SMAWsf/SA_libvirtgr.cfgファイルのクラスタホストのCFノード名(CFNameX)に対応した、ゲストOSのドメイン名(domainX)とハイパーバイザーのIPアドレス(ip-address)が設定されているか確認してください。設定に誤りがあった場合、誤ったノードが強制停止されることがあります。

    • SA_libvirtgpによるノード(ゲストOS)強制停止後、ゲストOSが一時停止状態のままになることがあります(管理OSの/var/crash配下に空き容量がない場合など)。このような場合、ゲストOSをvirsh destroyコマンドで強制停止してください。

  3. ハイパーバイザーへのログイン

    シャットダウン機構は、対象ノードへSSHでアクセスするため、SSH初回時のユーザ問い合わせ(RSA 鍵の生成)を済ませておく必要があります。

    全ゲストOS(ノード)上でそれぞれ、2. で設定したすべてのハイパーバイザーのIP アドレス (ip-address) に対して、シャットダウン機構用のユーザでログインを実行してください。

    # ssh -l user XXX.XXX.XXX.XXX
    The authenticity of host 'XXX.XXX.XXX.XXX (XXX.XXX.XXX.XXX)' can't be established.
    RSA key fingerprint is xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx.
    Are you sure you want to continue connecting (yes/no)? yes ←yes と入力
  4. シャットダウンデーモンの設定

    /etc/opt/SMAW/SMAWsf/rcsd.cfgを以下のような内容で作成します。

    CFNameX,weight=weight,admIP=myadmIP:agent=SA_xxxx,timeout=35
    CFNameX,weight=weight,admIP=myadmIP:agent=SA_xxxx,timeout=35
    CFNameX       :クラスタホストのCFノード名を指定します。
    weight        :SFのノードの重みを指定します。
    myadmIP       :自ゲストOS(ノード)の管理LANのIPアドレスを指定します。
    SA_xxxx       :シャットダウンエージェントの名前を指定します。
                    ここでは、“SA_libvirtgp”または“SA_libvirtgr”を指定します。

    例)設定例を以下に示します。

    # cat /etc/opt/SMAW/SMAWsf/rcsd.cfg
    node1,weight=1,admIP=10.20.30.100:agent=SA_libvirtgp,timeout=35:agent=SA_libvirtgr,timeout=35
    node2,weight=1,admIP=10.20.30.101:agent=SA_libvirtgp,timeout=35:agent=SA_libvirtgr,timeout=35

    注意

    • rcsd.cfgファイルで設定するシャットダウンエージェントは、SA_libvirtgp、SA_libvirtgrの順番で両方のシャットダウンエージェントを設定してください。

    • SA_libvirtgp.cfg、SA_libvirtgr.cfg、rcsd.cfgファイルの内容はすべてのゲストOS(ノード)で同一にしてください。同一でない場合誤動作します。

  5. シャットダウン機構の起動

    全ノードでシャットダウン機構が起動済か確認してください。

    # sdtool -s

    シャットダウン機構が起動済の場合、以下を実行して全ノードでシャットダウン機構を再起動してください。

    # sdtool -e
    # sdtool -b

    シャットダウン機構が起動していない場合、以下を実行して全ノードでシャットダウン機構を起動してください。

    # sdtool -b
  6. シャットダウン機構の状態確認

    シャットダウン機能の状態を確認してください。

    # sdtool -s

    参考

    sdtool -s コマンドの表示結果について

    • 初期状態がInitFailed と表示された場合は、そのシャットダウンエージェントの初期化で問題が発生したことを示しています。

    • テスト状態にTestFailed と表示された場合は、クラスタホスト欄に表示されたノードを停止できるかどうかをエージェントがテストしている間に問題が発生したことを示しています。このような場合には、そのエージェントが使用しているソフトウェア、ハードウェア、ネットワーク資源、管理OSに何らかの問題が生じていることが考えられます。

    • SSHの最大同時接続数が"クラスタ構成ノード数"以下の場合、シャットダウン機構の状態が InitFailed または TestFailed で表示されることがあります。SSHの最大同時接続数が"クラスタ構成ノード数+1"以上となるように設定を変更してください。

    • 停止状態または初期状態にUnknown と表示された場合は、SF がノードの停止、経路のテスト、SA の初期化をまだ行っていないことを表しています。テスト状態および初期状態には、実際の状態が確認されるまで一時的にUnknown が表示されます。

    • TestFailed またはInitFailed が表示された場合は、SA ログファイル、/var/log/messagesまたは、/etc/sysconfig/libvirt-guestsを確認してください。ログファイルには、SA のテストまたは初期化に失敗した理由が記録されています。/etc/sysconfig/libvirt-guests については、“3.2.1.1 管理OSの設定”が行われているか確認してください。失敗した問題が解決されSF が再起動されると、状態の表示がInitWorked またはTestWorked に変わります。

5.1.2.5.3 vmchkhost

ここでは、仮想マシン環境でvmchkhost(管理OSクラスタ連携)をシャットダウン機構に設定する手順について説明します。

本設定は、vmSP(VM用クラスタ連携ツール)またはlibvirtをシャットダウン機構へ設定後に実施してください。

注意

下記の1.から6.までの操作はすべてのゲストOS(ノード)で実行してください。

参考

ログファイルについて

vmchkhost シャットダウンエージェントのログファイルは以下に出力されます。

  • /var/opt/SMAWsf/log/SA_vmchkhost.log

  1. パスワードの暗号化

    Xen環境では、vmSP(VM用クラスタ連携ツール)をシャットダウン機構に設定する際に使用した、すべての管理OSのアカウントFJSVvmSPの暗号化されたパスワードを使用します。

    KVM環境では、libvirtをシャットダウン機構に設定する際に使用した、シャットダウン機構用の一般権限ユーザの暗号化されたパスワードを使用します。

  2. シャットダウンエージェントを設定してください。

    /etc/opt/SMAW/SMAWsf/SA_vmchkhost.cfgを以下のような内容で作成します。

    guest-cfname host-cfname ip-address user password
    guest-cfname host-cfname ip-address user password
    guest-cfname      :ゲストOSのCFノード名です。
    host-cfname       :管理OSのCFノード名です。
    ip-address        :管理OSのIPアドレスです。
    user             :管理OSのアカウントです。
                      Xen環境の場合は、FJSVvmSPを固定で指定します。
                      KVM環境の場合は、libvirtをシャットダウン機構に設定する際に作成したユーザ名を指定します。
    password         :“user”で指定したアカウントのログインパスワードです。
                      1.のパスワードの暗号化で確認したものを指定します。

    例)設定例を以下に示します。

    node1(ゲストOSのCFノード名)が動作する管理OSのCFノード名がhostos1で、管理OSのIPアドレスが10.20.30.50、node2(ゲストOSのCFノード名)が動作する管理OSのCFノード名がhostos2で、管理OSのIPアドレスが10.20.30.51の場合

    Xen環境の場合

    # cat /etc/opt/SMAW/SMAWsf/SA_vmchkhost.cfg
    node1 hostos1 10.20.30.50 FJSVvmSP 3CA1wxVXKD8a93077BaEkA==
    node2 hostos2 10.20.30.51 FJSVvmSP 3CA1wxVXKD8a93077BaEkA==

    KVM環境の場合

    # cat /etc/opt/SMAW/SMAWsf/SA_vmchkhost.cfg
    node1 hostos1 10.20.30.50 user D0860AB04E1B8FA3
    node2 hostos2 10.20.30.51 user D0860AB04E1B8FA3

    注意

    • /etc/opt/SMAW/SMAWsf/SA_vmchkhost.cfgファイルの設定内容が正しいか確認してください。設定内容に誤りがあった場合、シャットダウン機構が正常に動作できなくなります。

    • /etc/opt/SMAW/SMAWsf/SA_vmchkhost.cfgファイルのクラスタホストのCFノード名(CFNameX)に対応した、ゲストOSのドメイン名(domainX)と管理OSのIPアドレス(ip-address)が設定されているか確認してください。設定に誤りがあった場合、シャットダウン機構が正常に動作できなくなります。

  3. 管理OSへのログイン

    シャットダウン機構は、対象ノードへSSHでアクセスするため、SSH初回時のユーザ問い合わせ(RSA 鍵の生成)を済ませておく必要があります。

    vmSP(VM用クラスタ連携ツール) またはlibvirtをシャットダウン機構に設定する際にSSH初回時のユーザ問い合わせ(RSA 鍵の生成)を済ませているか確認してください。

  4. シャットダウンデーモンの設定

    /etc/opt/SMAW/SMAWsf/rcsd.cfgを以下のような内容で作成します。

    CFNameX,weight=weight,admIP=myadmIP:agent=SA_xxxx,timeout=35
    CFNameX,weight=weight,admIP=myadmIP:agent=SA_xxxx,timeout=35
    CFNameX       :クラスタホストのCFノード名を指定します。
    weight        :SFのノードの重みを指定します。
    myadmIP       :自ゲストOS(ノード)の管理LANのIPアドレスを指定します。
    SA_xxxx       :シャットダウンエージェントの名前を指定します。
                    ここでは、“SA_vmchkhost”を指定します。

    例)設定例を以下に示します。

    Xen環境の場合

    # cat /etc/opt/SMAW/SMAWsf/rcsd.cfg
    node1,weight=2,admIP=fuji2:agent=SA_vmSPgp,timeout=35:agent=SA_vmSPgr,timeout=35:agent=SA_vmchkhost,timeout=35
    node2,weight=1,admIP=fuji3:agent=SA_vmSPgp,timeout=35:agent=SA_vmSPgr,timeout=35:agent=SA_vmchkhost,timeout=35

    KVM環境の場合

    # cat /etc/opt/SMAW/SMAWsf/rcsd.cfg
    node1,weight=2,admIP=fuji2:agent=SA_libvirtgp,timeout=35:agent=SA_libvirtgr,timeout=35:agent=SA_vmchkhost,timeout=35
    node2,weight=1,admIP=fuji3:agent=SA_libvirtgp,timeout=35:agent=SA_libvirtgr,timeout=35:agent=SA_vmchkhost,timeout=35

    注意

    rcsd.cfgファイルで設定するシャットダウンエージェントは、SA_vmSPgp、SA_vmSPgr、SA_vmchkhostの順番で両方のシャットダウンエージェントを設定してください。

    SA_vmchkhost.cfg、rcsd.cfgファイルの内容はすべてのゲストOS(ノード)で同一にしてください。同一でない場合誤動作します。

  5. シャットダウン機構の起動

    全ノードでシャットダウン機構が起動済か確認してください。

    # sdtool -s

    シャットダウン機構が起動済の場合、以下を実行して全ノードでシャットダウン機構を再起動してください。

    # sdtool -e
    # sdtool -b

    シャットダウン機構が起動していない場合、以下を実行して全ノードでシャットダウン機構を起動してください。

    # sdtool -b
  6. シャットダウン機構の状態確認

    シャットダウン機能の状態を確認してください。

    # sdtool -s

    参考

    sdtool -s コマンドの表示結果について

    • 初期状態がInitFailed と表示された場合は、そのシャットダウンエージェントの初期化で問題が発生したことを示しています。

    • テスト状態にTestFailed と表示された場合は、クラスタホスト欄に表示されたノードを停止できるかどうかをエージェントがテストしている間に問題が発生したことを示しています。このような場合には、そのエージェントが使用しているソフトウェア、ハードウェア、ネットワーク資源、管理OSに何らかの問題が生じていることが考えられます。

    • SSHの最大同時接続数が"クラスタ構成ノード数"以下の場合、シャットダウン機構の状態が InitFailed または TestFailed で表示されることがあります。SSHの最大同時接続数が"クラスタ構成ノード数+1"以上となるように設定を変更してください。

    • 停止状態または初期状態にUnknown と表示された場合は、SF がノードの停止、経路のテスト、SA の初期化をまだ行っていないことを表しています。テスト状態および初期状態には、実際の状態が確認されるまで一時的にUnknown が表示されます。

    • TestFailed またはInitFailed が表示された場合は、SA ログファイルまたは、/var/log/messages を確認してください。ログファイルには、SA のテストまたは初期化に失敗した理由が記録されています。失敗した問題が解決されSF が再起動されると、状態の表示がInitWorked またはTestWorked に変わります。