PRIMECLUSTER導入運用手引書 4.2 (Linux版) |
目次 索引 |
第2部 導入編 | > 第5章 クラスタの構築 | > 5.1 クラスタの初期設定 |
シャットダウン機構の設定手順を示します。
シャットダウン機構についての詳細は、以下のマニュアルを参照してください。
"PRIMECLUSTER コンセプトガイド"の"3.3.1.8 PRIMECLUSTER SF"
"PRIMECLUSTER Cluster Foundation 導入運用手引書"の"8 シャットダウン機構 (SF)"
◆生存優先度
クラスタインタコネクトの障害によりクラスタパーティションが発生した場合、まだ全ノードがユーザ資産にアクセスできる状態にあります。クラスタパーティションについては、"PRIMECLUSTER コンセプトガイド"の"2.2.2.1 データ整合性の保証"を参照してください。
ユーザ資産であるデータの整合性を保証するために、生存させるノード群と強制停止させるノード群を決定する必要があります。
PRIMECLUSTERでは、それぞれのノード群に対する重み付けを「生存優先度」と呼んでいます。
ノードの重みが大きいほど生存優先度は高くなり、小さくなるにつれて生存優先度は低くなります。ノード群の生存優先度が同じ場合は、ノード名がアルファベット順で最も早いノードを含むノード群が生存します。
生存優先度は、以下の計算で求められます。
生存優先度=SFのノードの重み(weight)+userApplicationの ShutdownPriority
userApplicationのShutdownPriority属性については、"PRIMECLUSTER RMS 導入運用手引書"の"9.1 ユーザ設定属性"を参照してください。
以下に、代表的なケースをもとに、生存優先度の設計指針を示します。[最も多くのノードを生存させたい場合]
全てのノードのweightを1(デフォルト)に設定
全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定
[特定のノードを生存させたい場合]
生存させるノードのweightをその他ノードのweightの合計の2倍以上の値に設定
全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定
以下は、node1を生存させる場合の例です。[特定のアプリケーションが動作しているノードを生存させたい場合]
全てのノードのweightを1(デフォルト)に設定
動作を続けさせるユーザアプリケーションのShutdownPriority属性をその他のユーザアプリケーションのShutdownPriority属性と全てのノードのweightの合計の2倍以上の値に設定
以下は、app1が動作しているノードを生存させる場合の例です。
《シャットダウンデーモンの設定》
全ノードで/etc/opt/SMAW/SMAWsf/rcsd.cfgを以下のような内容で作成します。
CFNameX,weight=weight,admIP=myadmIP: agent=SA_xxx,timeout=20 |
CFNameX : クラスタホストのCFノード名を指定します。 weight : SFのノードの重みを指定します。 myadmIP : 自ノードの業務LANのIPアドレスを指定します。 agent=SA_xxx : シャットダウンエージェントの名前を指定します。 - RSBシャットダウンエージェントの場合 SA_rsbを指定します。 - IPMIシャットダウンエージェントの場合 SA_ipmiを指定します。 - BLADEシャットダウンエージェントの場合 SA_bladeを指定します。
例)RSBシャットダウンエージェントの場合
node1, weight=1, admIP=10.20.30.100: agent=SA_rsb, timeout=20 |
例)IPMIシャットダウンエージェントの場合
node1, weight=1, admIP=10.20.30.100: agent=SA_ipmi, timeout=25 |
例)BLADEシャットダウンエージェントの場合
node1, weight=1, admIP=10.20.30.100: agent=SA_blade, timeout=20 |
IPMIシャットダウンエージェントの場合、timeoutには "25" を指定します。
/etc/opt/SMAW/SMAWsf/rcsd.cfgファイルを作成する場合、/etc/opt/SMAW/SMAWsf/rcsd.cfg.templateファイルを雛型として使用することができます。
《RSBシャットダウンエージェントの設定》
リモートサービスボード(RSB)が搭載されているサーバの場合、RSBシャットダウンエージェントを設定してください。
RSBシャットダウンエージェントの設定は、Netdumpシャットダウンエージェント、または Diskdumpシャットダウンエージェントの設定前に行ってください。
全ノードで/etc/opt/SMAW/SMAWsf/SA_rsb.cfgを以下のような内容で作成します。
CFName1 ip-address:[port]:[user]:[passwd] [cycle | leave-off] |
CFNameX : クラスタホストのCFノード名 ip-address : リモートサービスボードのIPアドレス port : 未使用 user : リモートサービスボード設定時に定義したユーザ名 passwd : リモートサービスボード設定時に定義したパスワード cycle : ノード強制停止後、リブートします。 leave-off : ノード強制停止後、電源切断します。
例)
node1 10.20.30.50::root:rsbpwd cycle |
/etc/opt/SMAW/SMAWsf/SA_rsb.cfgファイルを作成する場合、/etc/opt/SMAW/SMAWsf/SA_rsb.cfg.templateファイルを雛型として使用することができます。
/etc/opt/SMAW/SMAWsf/SA_rsb.cfgファイルのパーミッションを、以下のコマンドを実行して600に変更してください。# chmod 600 /etc/opt/SMAW/SMAWsf/SA_rsb.cfg
上記ファイルの[cycle | leave-off] の設定に従って、パニックノードのクラッシュダンプ完了後の動作をそれぞれ[リブート | 電源断]に設定しておく必要があります。
パニックノードのクラッシュダンプ完了後の動作は/etc/sysconfig/dump 内の DUMP_ACTION 変数により定義します。
《IPMIシャットダウンエージェントの設定》
IPMI(BMC:Baseboard Management Controller)が搭載されているサーバの場合、IPMIシャットダウンエージェントを設定してください。
IPMIシャットダウンエージェントの設定は、Netdumpシャットダウンエージェント、またはDiskdumpシャットダウンエージェントの設定前に行ってください。
全ノードで/etc/opt/SMAW/SMAWsf/SA_ipmi.cfgを以下のような内容で作成します。
CFName1 ip-address:[user]:[passwd] [cycle | leave-off] |
CFNameX : クラスタホストのCFノード名 ip-address : IPMI(BMC)のIPアドレス user : IPMI(BMC)設定時に定義したユーザ名 passwd : IPMI(BMC)設定時に定義したパスワード cycle : ノード強制停止後、リブートします。 leave-off : ノード強制停止後、電源切断します。
例)
node1 10.20.30.50:root:bmcpwd cycle |
/etc/opt/SMAW/SMAWsf/SA_ipmi.cfgファイルを作成する場合、/etc/opt/SMAW/SMAWsf/SA_ipmi.cfg.templateファイルを雛形として使用することができます。
/etc/ opt/SMAW/SMAWsf/SA_ipmi.cfgファイルのパーミッションを、以下のコマンドを実行して600に変更してください。# chmod 600 /etc/opt/SMAW/SMAWsf/SA_ipmi.cfg
《BLADEシャットダウンエージェントの設定》
ブレードサーバの場合、BLADEシャットダウンエージェントを設定してください。
BLADEシャットダウンエージェントの設定は、Netdumpシャットダウンエージェント、またはDiskdumpシャットダウンエージェントの設定前に行ってください。
全ノードで/etc/opt/SMAW/SMAWsf/SA_blade.cfgを以下のような内容で作成します。
(1) 同一シャーシ内のクラスタ構成の場合
management-blade-ip IPaddress |
(2) 複数シャーシのクラスタ構成の場合
community-string SNMPcommunity |
IPaddress : マネージメントブレードのIPアドレス SNMPcommunity : SNMP コミュニティ CFNameX : クラスタホストのCFノード名 slot-no : サーバブレードのスロット番号 cycle : ノード強制停止後、リブートします。 leave-off : ノード強制停止後、電源切断します。
例1)
management-blade-ip 10.20.30.50 |
例2)
community-string public |
/etc/opt/SMAW/SMAWsf/SA_blade.cfgを作成する場合、/etc/opt/SMAW/SMAWsf/SA_blade.cfg.templateファイルを雛型として使用することができます。
/etc/opt/SMAW/SMAWsf/SA_blade.cfgファイルのパーミッションを、以下のコマンドを実行して600に変更してください。# chmod 600 /etc/opt/SMAW/SMAWsf/SA_blade.cfg
rcsd.cfg, SA_rsb.cfg, SA_ipmi.cfg, SA_blade.cfgファイルの内容は全ノードで同一にしてください。同一でない場合、誤動作することがあります。
《Netdumpシャットダウンエージェントの設定》
クラスタノードの基本ソフトウェアとして、Red Hat Enterprise Linux AS v.3 またはRed Hat Enterprise Linux ES v.3 を使用している場合、Netdumpシャットダウンエージェントを設定してください。
Netdump用定義ファイルの初期化
クラスタシステムを構成するいずれかのノードで以下のコマンドを実行します。
# /etc/opt/FJSVcllkcd/bin/panicinfo_setup
本コマンドは、CFおよびCFのサービス(CFSH, CFCP)が動作していることを前提としています。設定の詳細については、"CF、CIPの設定"の注意事項を参照してください。
クラッシュダンプ採取の設定
設定方法はノードの機種により異なります。
PRIMERGY TX600, RX800の場合
全ノードで /etc/opt/FJSVcllkcd/etc/SA_lkcd.tout の RSB_PANIC の値を以下に変更します。
変更前
RSB_PANIC 0
変更後
RSB_PANIC 1
PRIMERGY TX200 S2, RX300 S2, RX600 S2の場合
全ノードで/etc/opt/FJSVcllkcd/etc/SA_lkcd.toutのRSB_PANICの値を以下に変更します。
変更前
RSB_PANIC 0
変更後
RSB_PANIC 3
全ノードで/etc/opt/FJSVcllkcd/etc/SA_lkcd.toutのPANICINFO_TIMEOUTの値を以下に変更します。
変更前
PANICINFO_TIMEOUT 5
変更後
PANICINFO_TIMEOUT 10
ブレードサーバの場合 (PRIMERGY BX600, BX660, BX620 S2)
全ノードで /etc/opt/FJSVcllkcd/etc/SA_lkcd.tout の RSB_PANIC の値を以下に変更します。
変更前
RSB_PANIC 0
変更後
RSB_PANIC 2
PRIMERGY RX300の場合
PRIMERGY RX300の場合のクラッシュダンプ採取の設定は、"Netdump用定義ファイルの初期化" を行った後に実施してください。
全ノードの/etc/opt/SMAW/SMAWsf/rcsd.cfgに ":agent=SA_user,timeout=20" を追加します。
追加する位置は、各行の "CFNameX,weight=weight,admIP=myadmIP" の後です。
例)
node1,weight=1,admIP=10.20.30.100:agent=SA_user,timeout=20:agent=SA_lkcd,timeout=20:agent=SA_rsb,timeout=20 |
SA_lkcdは、panicinfo_setup実行時に設定されます。
《Diskdumpシャットダウンエージェントの設定》
基本ソフトウェア(*1)を使用したクラスタノードの場合、かつ、Diskdumpを利用したクラスタ高速切替機能をサポートしているPRIMERGY(*2)の場合、Diskdumpシャットダウンエージェントを設定することができます。
*1:
Red Hat Enterprise Linux AS v.3 一括修正 U05011以降
Red Hat Enterprise Linux ES v.3 一括修正 U05011以降
Red Hat Enterprise Linux AS v.4 一括修正 U05011以降
*2:PRIMERGY TX600, RX800, TX200 S2, RX300 S2, RX600 S2, BX660, BX620 S2
Diskdump用定義ファイルの初期化
クラスタシステムを構成するいずれかのノードで以下のコマンドを実行します。
# /etc/opt/FJSVcllkcd/bin/panicinfo_setup
本コマンドは、CFおよびCFのサービス(CFSH, CFCP)が動作していることを前提としています。設定の詳細については、"CF、CIPの設定"の注意事項を参照してください。
また、RSB シャットダウンエージェント、IPMIシャットダウンエージェント、およびBLADE シャットダウンエージェントの設定を事前に行う必要があります。
クラッシュダンプ採取の設定
設定方法はノードの機種により異なります。
PRIMERGY TX600の場合
全ノードで /etc/opt/FJSVcllkcd/etc/SA_lkcd.tout の RSB_PANIC の値を以下に変更します。
変更前
RSB_PANIC 0
変更後
RSB_PANIC 1
PRIMERGY (TX200 S2, RX300 S2, RX600 S2)の場合
全ノードで/etc/opt/FJSVcllkcd/etc/SA_lkcd.toutのRSB_PANICの値を以下に変更します。
変更前
RSB_PANIC 0
変更後
RSB_PANIC 3
全ノードで/etc/opt/FJSVcllkcd/etc/SA_lkcd.toutのPANICINFO_TIMEOUTの値を以下に変更します。
変更前
PANICINFO_TIMEOUT 5
変更後
PANICINFO_TIMEOUT 10
全ノードで/etc/opt/SMAW/SMAWsf/rcsd.cfgのSA_lkcdのtimeout値を以下に変更します。
変更前
agent=SA_lkcd,timeout=20
変更後
agent=SA_lkcd,timeout=25
ブレードサーバの場合 (PRIMERGY BX660, BX620 S2)
全ノードで/etc/opt/FJSVcllkcd/etc/SA_lkcd.toutのRSB_PANICの値を以下に変更します。
変更前
RSB_PANIC 0
変更後
RSB_PANIC 2
PRIMERGY RX300の場合
PRIMERGY RX300の場合のクラッシュダンプ採取の設定は、"Diskdump用定義ファイルの初期化" を行った後に実施してください。
全ノードの/etc/opt/SMAW/SMAWsf/rcsd.cfgに":agent=SA_user,timeout=20"を追加します。
追加する位置は、各行の "CFNameX,weight=weight,admIP=myadmIP" の後です。
例)
node1,weight=1,admIP=10.20.30.100:agent=SA_user,timeout=20:agent=SA_lkcd,timeout=20:agent=SA_rsb,timeout=20 |
SA_lkcdは、panicinfo_setup実行時に設定されます。
《シャットダウンデーモンの起動》
全ノードでシャットダウンデーモン(rcsd)を起動または再起動させます。
rcsdが未起動の場合は、sdtool -bを実行します。rcsdが動作中の場合は sdtool -eでrcsdを停止してsdtool -bを実行します。rcsdが動作中かどうかは sdtool -sで確認できます。
# sdtool -b
または
# sdtool -e # sdtool -b
目次 索引 |