ここでは、PRIMECLUSTERのクラスタ初期設定について説明します。
“PRIMECLUSTER 導入運用手引書”の“5.1.1 CF、CIPの設定”を参照し、CF、CIPの設定を行ってください。
注意
Azure環境では、メンテナンスのため通知なく、最大30秒間仮想マシンの一時停止が行われ、ハートビート切れが発生する場合があります。通知なしメンテナンス時にハートビート切れを発生させないようにする場合は、CFの設定後、“PRIMECLUSTER 導入運用手引書”の“11.3.1 CFハートビートのタイムアウト検出時間の変更”を参照して、クラスタタイムアウトの値を30秒以上にチューニングしてください。
ここでは、Azure環境のシャットダウン機構の設定方法について説明します。
Azure環境で使用可能なシャットダウンエージェントは以下のとおりです。
Azure CLI
Azure CLI シャットダウンエージェント SA_vmazureResetは、Azure 環境において、Azure CLI を使用したノード (仮想マシン) のシャットダウン機能を提供します。
ログファイルの格納場所は以下です。
/var/opt/SMAWsf/log/SA_vmazureReset.log
生存優先度については、“PRIMECLUSTER 導入運用手引書”の“5.1.2.1 生存優先度”を参照してください。
注意
シャットダウンエージェント設定後は、正しいノードが強制停止できることを確認するため、クラスタノード強制停止テストを実施してください。クラスタノード強制停止テストの詳細については、“PRIMECLUSTER 導入運用手引書”の“1.4 テスト”を参照してください。
SA_vmazureReset.cfg、rcsd.cfgファイルの内容はすべてのノードで同一にしてください。同一でない場合誤動作します。
シングルノードクラスタの場合は、設定不要です。
シャットダウンデーモンの設定
クラスタシステムを構成するすべてのノードで、/etc/opt/SMAW/SMAWsf/rcsd.cfgを以下のような内容で作成します。
CFNameX,weight=weight,admIP=myadmIP:agent=SA_vmazureReset,timeout=timeout CFNameX,weight=weight,admIP=myadmIP:agent=SA_vmazureReset,timeout=timeout
CFNameX :クラスタホストのCFノード名を指定します。 weight :SFのノードの重みを指定します。 myadmIP :クラスタホストのシャットダウン機構で使用する管理LANのIPアドレスを指定します。 指定可能なアドレス形式は、IPv4アドレスです。 ホスト名を指定する場合は、/etc/hostsに記載されていることを確認してください。 SA_vmazureReset:Azureシャットダウンエージェントです。 timeout :Azureシャットダウンエージェントのタイムアウト時間(秒)を指定します。 45秒を指定します。
例)設定例を以下に示します。
クラスタホストのCFノード名がnode1/node2、2ノードの重みが1、node1の管理LANのIPアドレスが192.168.250.1、node2の管理LANのIPアドレスが192.168.250.2の場合
# cat /etc/opt/SMAW/SMAWsf/rcsd.cfg
node1,weight=1,admIP=192.168.250.1:agent=SA_vmazureReset,timeout=45
node2,weight=1,admIP=192.168.250.2:agent=SA_vmazureReset,timeout=45
/etc/opt/SMAW/SMAWsf/rcsd.cfgを作成後、オーナー、グループ、アクセス権を以下のように設定します。
# chown root:root /etc/opt/SMAW/SMAWsf/rcsd.cfg # chmod 600 /etc/opt/SMAW/SMAWsf/rcsd.cfg
参考
/etc/opt/SMAW/SMAWsf/rcsd.cfgファイルを作成する場合、/etc/opt/SMAW/SMAWsf/rcsd.cfg.templateファイルをひな形として使用できます。
シャットダウンエージェントの設定
クラスタシステムを構成するすべてのノードで、/etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfgを以下のような内容で作成します。
参考
SA_vmazureReset.cfgファイルのひな形は以下の場所にあります。
/etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfg.template
項目の間は半角スペースで区切ってください。
CFNameX ResourceID AppID TenantID CertPath {cycle | leave-off} CFNameX ResourceID AppID TenantID CertPath {cycle | leave-off}
CFNameX :クラスタホストのCFノード名を指定します。 ResourceID :クラスタホストが動作しているAzureの仮想マシンのリソースIDを指定します。 AppID :サービスプリンシパル登録時のアプリケーションID(“27.3 事前設定”の手順3.で控えた値)を指定します。 TenantID :サービスプリンシパル登録時のテナントID(“27.3 事前設定”の手順3.で控えた値)を指定します。 CertPath :証明書のパス(“27.3 事前設定”の手順3.で控えた値)を指定します。 cycle :ノード強制停止後、再起動します。 leave-off :ノード強制停止後、再起動しません。
例)node1とnode2の各項目が以下の場合で、ノード強制停止後に再起動する場合の設定例を示します。
CFNameX | ResourceID | AppID | TenantID | CertPath |
---|---|---|---|---|
node1 | /subscriptions/1e234d12-39b8-49db-881a-35aa03b402b9/resourceGroups/pcl/providers/Microsoft.Compute/virtualMachines/node1 | d5b7dac1-718f-448b-8e11-4a8cca6d9004 | 8ff7ddfd-fbcb-4700-ae52-6d071ac8d1b4 | /root/examplecert.pem |
node2 | /subscriptions/1e234d12-39b8-49db-881a-35aa03b402b9/resourceGroups/pcl/providers/Microsoft.Compute/virtualMachines/node2 |
# cat /etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfg
node1 /subscriptions/1e234d12-39b8-49db-881a-35aa03b402b9/resourceGroups/pcl/providers/Microsoft.Compute/virtualMachines/node1 d5b7dac1-718f-448b-8e11-4a8cca6d9004 8ff7ddfd-fbcb-4700-ae52-6d071ac8d1b4 /root/examplecert.pem cycle node2 /subscriptions/1e234d12-39b8-49db-881a-35aa03b402b9/resourceGroups/pcl/providers/Microsoft.Compute/virtualMachines/node2 d5b7dac1-718f-448b-8e11-4a8cca6d9004 8ff7ddfd-fbcb-4700-ae52-6d071ac8d1b4 /root/examplecert.pem cycle
/etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfgを作成後、オーナー、グループ、アクセス権を以下のように設定します。
# chown root:root /etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfg
# chmod 600 /etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfg
注意
/etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfgファイルの設定内容が正しいか確認してください。設定内容に誤りがあった場合、シャットダウン機構が正常に動作できなくなります。
/etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfgファイルのクラスタホストのCFノード名(CFNameX)に対応した、仮想マシンのリソースID(ResourceID)が設定されているか確認してください。また、サービスプリンシパルの登録および証明書の作成時に生成されたアプリケーションID(AppID)、テナントID(TenantID)、および証明書のパス(CertPath)が正しく設定されているか確認してください。設定に誤りがあった場合、誤ったノードが強制停止されることがあります。
シャットダウン機構の起動
クラスタシステムを構成するすべてのノードで、シャットダウン機構が起動済みか確認してください。
# sdtool -s
シャットダウン機構が起動済みのノードでは、以下を実行してシャットダウン機構を再起動してください。
# sdtool -e # sdtool -b
シャットダウン機構が起動していないノードでは、以下を実行してシャットダウン機構を起動してください。
# sdtool -b
参考
シャットダウン機構が起動済みかは、sdtool -s コマンドで確認できます。“The RCSD is not running”と表示された場合、シャットダウン機構が起動していません。
シャットダウン機構の状態確認
クラスタシステムを構成するすべてのノードで、以下のコマンドを実行し、シャットダウン機構の状態を確認してください。
# sdtool -s
注意
“The RCSD is not running”と表示された場合、シャットダウンデーモンの設定、またはシャットダウンエージェントの設定に誤りがあります。手順1.~3.を再実施してください。
参考
sdtool -s コマンドの表示結果について
Init StateがUnknown、Init-ingと表示された場合、1分ほど待ってから、再度確認してください。
ノード強制停止状態にUnknownと表示された場合は、SFがノードの停止をまだ行っていないことを示しています。初期化状態にUnknownと表示された場合は、SAの初期化、経路のテストをまだ行っていないことを示しています。テスト状態および初期化状態には、実際の状態が確認されるまで一時的にUnknown が表示されます。
テスト状態にTestFailed と表示された場合は、クラスタホスト欄に表示されたノードを停止できるかどうかをエージェントがテストしている間に問題が発生したことを示しています。このような場合には、そのエージェントが使用しているソフトウェア、ハードウェア、ネットワーク資源に何らかの問題が生じていることが考えられます。
“PRIMECLUSTER 導入運用手引書”の“5.1.3 クラスタリソース管理機構の初期設定”を参照し、クラスタリソース管理機構が管理するリソースデータベースの設定をしてください。本設定の中で、GDSのサーバ間ミラーリングで使用するiSCSIデバイスの設定とリソースデータベースへの登録をします。