クラスタ高速切替機能に関連するソフトウェアとハードウェアの設定を行う必要があります。
本設定はOSおよびPRIMECLUSTERインストール後に行ってください。
■概要
クラスタシステムを構成するノードの1つに異常が発生しハートビートが失敗した場合、PRIMECLUSTERシャットダウン機構は異常が発生したノードの電源を強制的に切断します。
ハートビートの失敗要因がパニックであった場合、クラッシュダンプ採取中に強制電源切断すると、クラッシュダンプ採取が途中で終了してしまうため、異常原因を調査するうえで必要な資料が採取できなくなる場合があります。
クラスタ高速切替機能は、上記の問題を防止するためにクラッシュダンプ採取中の強制電源切断を抑止し、同時に異常発生ノードのクラッシュダンプ採取中のフェイルオーバを実現する機能です。
注意
PRIMERGY RX1330M3,RX4770M3,TX1320M3,TX1330M3のRHEL8環境およびPRIMERGY CX1430M1の環境では、クラスタ高速切替機能を使用できません。
■kdump
上図に示すように、ハートビート失敗時にクラスタ高速切替機能は iRMCを利用してパニックステータスを設定/参照します。これにより、ハートビート異常を検出したノードは、クラッシュダンプ中のノードの強制電源切断をすることなくこれを停止状態とみなし、業務を引き継ぐことが可能となります。
注意
クラッシュダンプ採取中にパニックしたノードをリセットすると、クラッシュダンプ採取が正しく行われません。クラッシュダンプ採取中はリセット操作をしないでください。
パニックしたノードのクラッシュダンプ採取後の動作はkdumpの設定に従います。
シリアルコンソールを使用する環境において、シリアルコンソールが 300 ~ 38400 bps に設定されている場合、クラスタ高速切替機能が正常に動作せず、業務の切替えを行えないことがあります。シリアルコンソールは 57600 ~ 115200 bps に設定してください。
◆kdumpシャットダウンエージェントに必要な設定
kdumpの設定
kdumpを使用する場合は、事前にkdumpの設定を行う必要があります。
kdumpの設定手順の詳細は、OSのマニュアルを参照してください。
注意
Red Hat Enterprise Linuxのインストール時にkdumpの設定を行った場合も、再設定してください。
kdumpの確認
kdumpサーバ機能が利用可能となっていることを確認してください。利用可能となっていない場合は、利用可能にしてください。
systemctl(1)コマンドで、kdumpの利用可能状態を確認します。
例) 以下の場合、kdumpはdisabledです。
# /usr/bin/systemctl list-unit-files --type=service | grep kdump.service
kdump.service disabled
kdumpがdisabledになっている場合、systemctl(1)コマンドでenableにした後、kdumpを起動してください。
# /usr/bin/systemctl enable kdump.service # /usr/bin/systemctl start kdump.service
■その他シャットダウンエージェントに必要な設定
kdumpシャットダウンエージェントの設定が完了したら、IPMI(Intelligent Platform Management Interface)、あるいはブレードサーバの設定を行ってください。
参考
IPMIシャットダウンエージェントは、BMCあるいはiRMCが搭載されているハードウェア装置で使用するシャットダウンエージェントです。
◆IPMIシャットダウンエージェントに必要な設定
BMCあるいはiRMCの設定を行ってください。
IPアドレス
IPMIシャットダウンエージェント用のユーザ作成(*1)
IPMIの有効化(*2)
詳細は、各機種の“ユーザーズガイド”、およびServerView Operations Manager のマニュアルを参照してください。
*1) 作成するユーザには管理者権限を付与してください。また、作成するユーザのパスワードは以下の文字以外の7ビットASCII文字で設定してください。 > < " / \ = ! ? ; , &
*2) iRMCでIPMIを有効にするには、“IPMI over LAN”を有効にしてください。
◆Bladeシャットダウンエージェントに必要な設定
ブレードサーバの設定を行ってください。
ServerViewのインストール
マネージメントブレードのSNMPコミュニティ(*3)
マネージメントブレードのIPアドレス
詳細は、ServerView Operations Manager のマニュアル、および 装置添付の各種ハードウェアガイドを参照してください。
*3) 複数のシャーシ間でクラスタを構築する場合は、全てのシャーシのマネージメントブレードでSNMPコミュニティ名を同一にしてください。
PRIMEQUEST 2000シリーズでクラスタシステムを構成するノードの1つに異常が発生した場合、PRIMECLUSTERシャットダウン機構は以下の2つの方法によってその異常を検出します。詳細については“PRIMECLUSTER コンセプトガイド”の“2.3.5 PRIMECLUSTER SF”を参照してください。
MMBを通じてのノードの状態変化(非同期監視)
クラスタノード間のハートビート(NSM:ノード状態モニタ)の失敗 (定周期監視)
非同期監視はノードの異常を即時に検出することができ、定周期監視で検出するよりもフェイルオーバが高速となります。
上図に示すように、パニック発生時にクラスタ制御はMMBによりパニック通知を受けます。これにより、ハートビート異常よりも早くノードのパニックを検出します。
参照
PRIMEQUESTでは、ダンプ環境を設定することにより、パニック時にクラッシュダンプを採取することができます。
PRIMEQUESTのダンプ機能、設定方法、および、確認方法については、以下のマニュアルを参照してください。
PRIMEQUEST 2000 シリーズ 導入マニュアル
PRIMEQUEST 2000 シリーズ ServerView Mission Critical Option ユーザマニュアル
非同期監視を利用するためには、MMBを制御するソフトウェアのインストールやドライバの適切な設定が必要です。本節では高速切替を実現するために必要なMMBを制御するソフトウェアのインストールやドライバの設定を説明します。
HBA閉塞機能とSVmcoのインストール
MMBを通じてのノードの状態変化はHBA閉塞機能とSVmcoによりシャットダウン機構に通知されます。シャットダウン機構の設定を行う前にHBA閉塞機能とSVmcoのインストールを行ってください。インストール方法については、以下のマニュアルを参照してください。
PRIMEQUEST 2000 シリーズ HBA閉塞機能説明書
PRIMEQUEST 2000 シリーズ 導入マニュアル
PRIMEQUEST 2000 シリーズ ServerView Mission Critical Option ユーザマニュアル
SVmcoおよびMMBの設定
MMBを通じてのノードの状態変化を正しくシャットダウン機構に通知させるためには、SVmcoおよびMMBの設定が必要です。シャットダウン機構の設定を行う前にSVmcoの設定を行ってください。設定方法については、以下のマニュアルを参照してください。
PRIMEQUEST 2000 シリーズ 導入マニュアル
PRIMEQUEST 2000 シリーズ ServerView Mission Critical Option ユーザマニュアル
また、PRIMECLUSTERがMMBと連携するために、RMCPのユーザを作成する必要があります。PRIMECLUSTERを構成するすべてのPRIMEQUEST 2000上にRMCPでMMBを制御するためのユーザを必ず作成してください。RMCPでMMBを制御するためのユーザを作成するには、MMB Web-UIにログインし、“Network Configuration”メニューの“Remote Server Management”画面から作成します。その際、以下のようなユーザを作成してください。
[Privilege]は「Admin」とする
[Status]は「Enabled」とする
作成するユーザのパスワードは以下の文字以外の7ビットASCII文字で設定してください。
> < " / \ = ! ? ; , &
RMCPでMMBを制御するためのユーザの作成方法については、本体装置添付の以下のマニュアルを参照してください。
PRIMEQUEST 2000 シリーズ 運用管理ツールリファレンス
ここで作成したユーザ名と設定したパスワードはシャットダウン機構の設定の際に使用します。メモしてください。
注意
MMBには以下の2種類のユーザが存在します。
MMB全体を制御するためのユーザ
RMCPでMMBを制御するためのユーザ
ここで作成するユーザはRMCPでMMBを制御するためのユーザです。
HBA閉塞機能の設定
注意
共用ディスクを使用する場合は、本設定を必ず行ってください。
パニックが発生した場合に共用ディスクに接続しているHBAを閉塞させ、共用ディスクへのI/O処理を打ち切ります。こうすることで、共用ディスク内のデータの整合性を保ちつつ、高速に切り替えることができます。
全ノードで、共用ディスクのデバイスパス(GDSを使用している場合はGDSのデバイスパス)をHBA閉塞機能用コマンドに指定し、HBAの機能停止を行う対象として共用ディスクを追加してください。本設定は、GDSを使用している場合はGDSの設定完了後に行ってください。設定方法については、以下のマニュアルを参照してください。
PRIMEQUEST 2000 シリーズ HBA閉塞機能説明書
I/O完了待ち時間の設定
パニックなどのノードダウンが発生しフェイルオーバする場合、共用ディスクへのI/Oの整合性を保つため、ノードダウンが発生してから新運用ノードが運用を開始するまでに、一定のI/O完了待ち時間が必要な共用ディスク装置があります。
I/O完了待ち時間の初期値として0秒を設定していますが、I/O完了待ち時間が必要な共用ディスク装置を使用している場合、この値を適切な値に設定してください。
参考
ETERNUS ディスクアレイの場合、I/O完了待ち時間が不要ですので、本設定を行う必要はありません。
本設定はCFの設定完了後に行ってください。設定方法については、“5.1.2.4.5 I/O完了待ち時間の設定”を参照してください。
注意
I/O完了待ち時間を設定した場合、パニックなどのノードダウン時の切替え時間がその時間分増加します。
PRIMEQUEST 3000シリーズでクラスタシステムを構成するノードの1つに異常が発生した場合、PRIMECLUSTERシャットダウン機構は以下の2つの方法によってその異常を検出します。詳細については“PRIMECLUSTER コンセプトガイド”の“2.3.5 PRIMECLUSTER SF”を参照してください。
iRMC/MMBを通じてのノードの状態変化(非同期監視)
クラスタノード間のハートビート(NSM:ノード状態モニタ)の失敗 (定周期監視)
非同期監視はノードの異常を即時に検出することができ、定周期監視で検出するよりもフェイルオーバが高速となります。
上図に示すように、パニック発生時にクラスタ制御はiRMC/MMBによりパニック通知を受けます。これにより、ハートビート異常よりも早くノードのパニックを検出します。
参照
PRIMEQUESTでは、ダンプ環境を設定することにより、パニック時にクラッシュダンプを採取することができます。
PRIMEQUESTのダンプ機能、設定方法、および、確認方法については、以下のマニュアルを参照してください。
PRIMEQUEST 3000 シリーズ導入マニュアル
非同期監視を利用するためには、必須ソフトウェアのインストールやドライバの適切な設定が必要です。本節では高速切替を実現するために必要なソフトウェアのインストールやドライバの設定を説明します。
HBA閉塞機能のインストール
iRMC/MMBを通じてのノードの状態変化はHBA閉塞機能によりシャットダウン機構に通知されます。シャットダウン機構の設定を行う前にHBA閉塞機能のインストールを行ってください。インストール方法については、以下のマニュアルを参照してください。
PRIMEQUEST 3000 シリーズ HBA閉塞機能説明書
iRMCの設定
iRMCを通じてのノードの状態変化を正しくシャットダウン機構に通知させるためには、iRMCの設定が必要です。シャットダウン機構の設定を行う前にiRMCの設定を行ってください。設定方法については、以下のマニュアルを参照してください。
PRIMEQUEST 3000 シリーズ導入マニュアル
また、PRIMECLUSTERがiRMCと連携するために、ユーザを作成する必要があります。PRIMECLUSTERを構成するすべてのPRIMEQUEST3000上にiRMCを制御するためのユーザを必ず作成してください。iRMCを制御するためのユーザを作成するには、set irmc user コマンドを使用してください。
作成するユーザのパスワードは以下の文字以外の7ビットASCII文字で設定してください。
> < " / \ = ! ? ; , &
set irmc user コマンドの使用法については、以下のマニュアルページを参照してください。
PRIMEQUEST 3000 シリーズ運用管理ツールリファレンス(MMB)
ここで作成したユーザ名と設定したパスワードはシャットダウン機構の設定の際に使用します。メモしてください。
拡張パーティションを使用してクラスタシステムを構成する場合、Home SBのVGA/USB/rKVMSがFreeになっていると、PRIMECLUSTERとiRMCが連携できません。いずれかの拡張パーティション(クラスタシステムを構成する拡張パーティション以外でも可)に割り当ててください。
拡張パーティションへのVGA/USB/rKVMSの割り当て方法については、以下のマニュアルを参照してください。
PRIMEQUEST 3000 シリーズ 運用管理ツールリファレンス(MMB)
MMBの設定
MMBを通じてのノードの状態変化を正しくシャットダウン機構に通知させるためには、MMBの設定が必要です。
また、PRIMECLUSTERがMMBと連携するために、RMCPのユーザを作成する必要があります。PRIMECLUSTERを構成するすべてのPRIMEQUEST3000上にRMCPでMMBを制御するためのユーザを必ず作成してください。RMCPでMMBを制御するためのユーザを作成するには、MMB Web-UIにログインし、“Network Configuration”メニューの“Remote Server Management”画面から作成します。その際、以下のようなユーザを作成してください。
[Privilege]は「Admin」とする
[Status]は「Enabled」とする
作成するユーザのパスワードは以下の文字以外の7ビットASCII文字で設定してください。
> < " / \ = ! ? ; , &
RMCPでMMBを制御するためのユーザの作成方法については、本体装置添付の以下のマニュアルを参照してください。
PRIMEQUEST 3000 シリーズ運用管理マニュアル
ここで作成したユーザ名と設定したパスワードはシャットダウン機構の設定の際に使用します。メモしてください。
注意
MMBには以下の2種類のユーザが存在します。
MMB全体を制御するためのユーザ
RMCPでMMBを制御するためのユーザ
ここで作成するユーザはRMCPでMMBを制御するためのユーザです。
HBA閉塞機能の設定
注意
共用ディスクを使用する場合は、本設定を必ず行ってください。
パニックが発生した場合に共用ディスクに接続しているHBAを閉塞させ、共用ディスクへのI/O処理を打ち切ります。こうすることで、共用ディスク内のデータの整合性を保ちつつ、高速に切り替えることができます。
全ノードで、共用ディスクのデバイスパス(GDSを使用している場合はGDSのデバイスパス)をHBA閉塞機能用コマンドに指定し、HBAの機能停止を行う対象として共用ディスクを追加してください。本設定は、GDSを使用している場合はGDSの設定完了後に行ってください。設定方法については、以下のマニュアルを参照してください。
PRIMEQUEST 3000 シリーズ HBA閉塞機能説明書
I/O完了待ち時間の設定
パニックなどのノードダウンが発生しフェイルオーバする場合、共用ディスクへのI/Oの整合性を保つため、ノードダウンが発生してから新運用ノードが運用を開始するまでに、一定のI/O完了待ち時間が必要な共用ディスク装置があります。
I/O完了待ち時間の初期値として0秒を設定していますが、I/O完了待ち時間が必要な共用ディスク装置を使用している場合、この値を適切な値に設定してください。
参考
ETERNUS ディスクアレイの場合、I/O完了待ち時間が不要ですので、本設定を行う必要はありません。
本設定はCFの設定完了後に行ってください。設定方法については、“5.1.2.5.5 I/O完了待ち時間の設定”を参照してください。
注意
I/O完了待ち時間を設定した場合、パニックなどのノードダウン時の切替え時間がその時間分増加します。