3.1.6 クラスタ高速切替機能の設定

■概要

クラスタシステムを構成するノードの1つに異常が発生しクラスタシステム間のハートビートが失敗した場合、PRIMECLUSTERシャットダウン機構は異常が発生したノードの電源を強制的に切断します。

ハートビートの失敗要因がパニックであった場合、クラッシュダンプ採取中に強制電源切断すると、クラッシュダンプ採取が途中で終了してしまうため、異常原因を調査するうえで必要な資料が採取できなくなる場合があります。

クラスタ高速切替機能は、上記の問題を防止するためにクラッシュダンプ採取中の強制電源切断を抑止し、同時に異常発生ノードのクラッシュダンプ採取中のフェイルオーバを実現する機能です。

■kdump

上図に示すように、ハートビート失敗時にクラスタ高速切替機能は BMC（Baseboard Management Controller）または iRMCを利用してパニックステータスを設定／参照します。これにより、ハートビート異常を検出したノードは、クラッシュダンプ中のノードの強制電源切断をすることなくこれを停止状態とみなし、業務を引き継ぐことが可能となります。

注意

クラッシュダンプ採取中にパニックしたノードをリセットすると、クラッシュダンプ採取が正しく行われません。クラッシュダンプ採取中はリセット操作をしないでください。
パニックしたノードのクラッシュダンプ採取後の動作はkdumpの設定に従います。

◆kdumpシャットダウンエージェントに必要な設定

kdumpの設定
kdumpを使用する場合は、事前にkdumpの設定を行う必要があります。
kdumpの設定手順の詳細は、OSのマニュアルを参照してください。
注意
Red Hat Enterprise Linuxのインストール時にkdumpの設定を行った場合も、再設定してください。
kdumpの確認
[RHEL6の場合]
kdumpサーバ機能が利用可能となっていることを確認してください。利用可能となっていない場合は、利用可能にしてください。
確認操作はrunlevel(8)コマンドとchkconfig(8)コマンドで行います。
- runlevel(8)コマンドで、現在のランレベルを確認します。
  例) 以下の場合、現在のランレベルは3です。
```
# /sbin/runlevel
N 3
```
- chkconfig(8)コマンドで、kdumpの利用可能状態を確認します。
  例) 以下の場合、現在のランレベル3のkdumpはoffです。
```
# /sbin/chkconfig --list kdump
kdump 0:off 1:off 2:off 3:off 4:off 5:off 6:off
```
- 現在のランレベルでkdumpがオフになっている場合、chkconfig(8)コマンドでオンにし、service コマンドで kdumpを起動してください。
```
# /sbin/chkconfig kdump on
# /sbin/service kdump start
```
[RHEL7の場合]
kdumpサーバ機能が利用可能となっていることを確認してください。利用可能となっていない場合は、利用可能にしてください。
確認操作はrunlevel(8)コマンドとsystemctl(1)コマンドで行います。
- runlevel(8)コマンドで、現在のランレベルを確認します。
  例) 以下の場合、現在のランレベルは3です。
```
# /sbin/runlevel
N 3
```
- systemctl(1)コマンドで、kdumpの利用可能状態を確認します。
  例) 以下の場合、現在のランレベル3のkdumpはdisabledです。
```
# /usr/bin/systemctl list-unit-files --type=service | grep kdump.service
kdump.service                               disabled
```
- 現在のランレベルでkdumpがdisabledになっている場合、systemctl(1)コマンドでenableにした後、kdumpを起動してください。
```
# /usr/bin/systemctl enable kdump.service
# /usr/bin/systemctl start kdump.service
```

■その他シャットダウンエージェントに必要な設定

kdumpシャットダウンエージェントの設定が完了したら、IPMI(Intelligent Platform Management Interface)、あるいはブレードサーバの設定を行ってください。

参考

IPMIシャットダウンエージェントは、BMCあるいはiRMCが搭載されているハードウェア装置で使用するシャットダウンエージェントです。

◆IPMIシャットダウンエージェントに必要な設定

BMCあるいはiRMCの設定を行ってください。

IPアドレス
IPMIシャットダウンエージェント用のユーザ作成(*1)

詳細は、各機種の“ユーザーズガイド”、およびServerView Operations Manager のマニュアルを参照してください。

*1) 作成するユーザには管理者権限を付与してください。また、作成するユーザのパスワードは以下の文字以外の7ビットASCII文字で設定してください。
    >  <  "  /  \  =  !  ?  ;  ,  &

◆Bladeシャットダウンエージェントに必要な設定

ブレードサーバの設定を行ってください。

ServerViewのインストール
マネージメントブレードのSNMPコミュニティ(*2)
マネージメントブレードのIPアドレス

詳細は、ServerView Operations Manager のマニュアル、および装置添付の各種ハードウェアガイドを参照してください。

*2) 複数のシャーシ間でクラスタを構築する場合は、全てのシャーシのマネージメントブレードでSNMPコミュニティ名を同一にしてください

3.1.6.2 PRIMEQUEST 2000シリーズの場合

PRIMEQUEST 2000シリーズでクラスタシステムを構成するノードの1つに異常が発生した場合、PRIMECLUSTERシャットダウン機構は以下の2つの方法によってその異常を検出します。詳細については“PRIMECLUSTER コンセプトガイド”の“2.3.5 PRIMECLUSTER SF”を参照してください。

MMBを通じてのノードの状態変化(非同期監視)
クラスタノード間のハートビート(NSM：ノード状態モニタ)の失敗 (定周期監視)

非同期監視はノードの異常を即時に検出することができ、定周期監視で検出するよりもフェイルオーバが高速となります。

上図に示すように、パニック発生時にクラスタ制御はMMBによりパニック通知を受けます。これにより、ハートビート異常よりも早くノードのパニックを検出します。

参照

PRIMEQUESTでは、ダンプ環境を設定することにより、パニック時にクラッシュダンプを採取することができます。
PRIMEQUESTのダンプ機能、設定方法、および、確認方法については、以下のマニュアルを参照してください。

PRIMEQUEST 2000 シリーズ導入マニュアル
PRIMEQUEST 2000 シリーズ ServerView Mission Critical Option ユーザマニュアル

非同期監視を利用するためには、MMBを制御するソフトウェアのインストールやドライバの適切な設定が必要です。本節では高速切替を実現するために必要なMMBを制御するソフトウェアのインストールやドライバの設定を説明します。

HBA閉塞機能とSVmcoのインストール
MMBを通じてのノードの状態変化はHBA閉塞機能とSVmcoによりシャットダウン機構に通知されます。シャットダウン機構の設定を行う前にHBA閉塞機能とSVmcoのインストールを行ってください。インストール方法については、以下のマニュアルを参照してください。
- PRIMEQUEST 2000 シリーズ HBA閉塞機能説明書
- PRIMEQUEST 2000 シリーズ導入マニュアル
- PRIMEQUEST 2000 シリーズ ServerView Mission Critical Option ユーザマニュアル
SVmcoおよびMMBの設定
MMBを通じてのノードの状態変化を正しくシャットダウン機構に通知させるためには、SVmcoおよびMMBの設定が必要です。シャットダウン機構の設定を行う前にSVmcoの設定を行ってください。設定方法については、以下のマニュアルを参照してください。
- PRIMEQUEST 2000 シリーズ導入マニュアル
- PRIMEQUEST 2000 シリーズ ServerView Mission Critical Option ユーザマニュアル
また、PRIMECLUSTERがMMBと連携するために、RMCPのユーザを作成する必要があります。PRIMECLUSTERを構成するすべてのPRIMEQUEST 2000上にRMCPでMMBを制御するためのユーザを必ず作成してください。RMCPでMMBを制御するためのユーザを作成するには、MMB Web-UIにログインし、“Network Configuration”メニューの“Remote Server Management”画面から作成します。その際、以下のようなユーザを作成してください。
- [Privilege]は「Admin」とする
- [Status]は「Enabled」とする
作成するユーザのパスワードは以下の文字以外の7ビットASCII文字で設定してください。
```
    >  <  "  /  \  =  !  ?  ;  ,  &
```
RMCPでMMBを制御するためのユーザの作成方法については、本体装置添付の以下のマニュアルを参照してください。
- PRIMEQUEST 2000 シリーズ運用管理ツールリファレンス
ここで作成したユーザ名と設定したパスワードはシャットダウン機構の設定の際に使用します。メモしてください。
注意
MMBには以下の2種類のユーザが存在します。
- MMB全体を制御するためのユーザ
- RMCPでMMBを制御するためのユーザ
ここで作成するユーザはRMCPでMMBを制御するためのユーザです。
HBA閉塞機能の設定
注意
共用ディスクを使用する場合は、本設定を必ず行ってください。
パニックが発生した場合に共用ディスクに接続しているHBAを閉塞させ、共用ディスクへのI/O処理を打ち切ります。こうすることで、共用ディスク内のデータの整合性を保ちつつ、高速に切り替えることができます。
全ノードで、共用ディスクのデバイスパス(GDSを使用している場合はGDSのデバイスパス)をHBA閉塞機能用コマンドに指定し、HBAの機能停止を行う対象として共用ディスクを追加してください。本設定は、GDSを使用している場合はGDSの設定完了後に行ってください。設定方法については、以下のマニュアルを参照してください。
- PRIMEQUEST 2000 シリーズ HBA閉塞機能説明書
I/O完了待ち時間の設定
パニックなどのノードダウンが発生しフェイルオーバする場合、共用ディスクへのI/Oの整合性を保つため、ノードダウンが発生してから新運用ノードが運用を開始するまでに、一定のI/O完了待ち時間が必要な共用ディスク装置があります。
I/O完了待ち時間の初期値として0秒を設定していますが、I/O完了待ち時間が必要な共用ディスク装置を使用している場合、この値を適切な値に設定してください。
参考
ETERNUS ディスクアレイの場合、I/O完了待ち時間が不要ですので、本設定を行う必要はありません。
本設定はCFの設定完了後に行ってください。設定方法については、“5.1.2.4.5 I/O完了待ち時間の設定”を参照してください。
注意
I/O完了待ち時間を設定した場合、パニックなどのノードダウン時の切替え時間がその時間分増加します。

3.1.6.3 PRIMEQUEST 3000シリーズの場合

PRIMEQUEST 3000シリーズでクラスタシステムを構成するノードの1つに異常が発生した場合、PRIMECLUSTERシャットダウン機構は以下の2つの方法によってその異常を検出します。詳細については“PRIMECLUSTER コンセプトガイド”の“2.3.5 PRIMECLUSTER SF”を参照してください。

iRMC/MMBを通じてのノードの状態変化(非同期監視)
クラスタノード間のハートビート(NSM：ノード状態モニタ)の失敗 (定周期監視)

非同期監視はノードの異常を即時に検出することができ、定周期監視で検出するよりもフェイルオーバが高速となります。

上図に示すように、パニック発生時にクラスタ制御はiRMC/MMBによりパニック通知を受けます。これにより、ハートビート異常よりも早くノードのパニックを検出します。

参照

PRIMEQUESTでは、ダンプ環境を設定することにより、パニック時にクラッシュダンプを採取することができます。

PRIMEQUESTのダンプ機能、設定方法、および、確認方法については、以下のマニュアルを参照してください。

PRIMEQUEST 3000 シリーズ導入マニュアル

非同期監視を利用するためには、必須ソフトウェアのインストールやドライバの適切な設定が必要です。本節では高速切替を実現するために必要なソフトウェアのインストールやドライバの設定を説明します。

HBA閉塞機能のインストール
iRMC/MMBを通じてのノードの状態変化はHBA閉塞機能によりシャットダウン機構に通知されます。シャットダウン機構の設定を行う前にHBA閉塞機能のインストールを行ってください。インストール方法については、以下のマニュアルを参照してください。
- PRIMEQUEST 3000 シリーズ HBA閉塞機能説明書
iRMCの設定
iRMCを通じてのノードの状態変化を正しくシャットダウン機構に通知させるためには、iRMCの設定が必要です。シャットダウン機構の設定を行う前にiRMCの設定を行ってください。設定方法については、以下のマニュアルを参照してください。
- PRIMEQUEST 3000 シリーズ導入マニュアル
また、PRIMECLUSTERがiRMCと連携するために、ユーザを作成する必要があります。PRIMECLUSTERを構成するすべてのPRIMEQUEST3000上にiRMCを制御するためのユーザを必ず作成してください。iRMCを制御するためのユーザを作成するには、set irmc user コマンドを使用してください。
作成するユーザのパスワードは以下の文字以外の7ビットASCII文字で設定してください。
```
    > < " / \ = ! ? ; , &
```
set irmc user コマンドの使用法については、以下のマニュアルページを参照してください。
- PRIMEQUEST 3000 シリーズ運用管理ツールリファレンス(MMB)
ここで作成したユーザ名と設定したパスワードはシャットダウン機構の設定の際に使用します。メモしてください。
拡張パーティションを使用してクラスタシステムを構成する場合、Home SBのVGA/USB/rKVMSがFreeになっていると、PRIMECLUSTERとiRMCが連携できません。いずれかの拡張パーティション(クラスタシステムを構成する拡張パーティション以外でも可)に割り当ててください。
拡張パーティションへのVGA/USB/rKVMSの割り当て方法については、以下のマニュアルを参照してください。
- PRIMEQUEST 3000 シリーズ運用管理ツールリファレンス(MMB)
MMBの設定
MMBを通じてのノードの状態変化を正しくシャットダウン機構に通知させるためには、MMBの設定が必要です。
また、PRIMECLUSTERがMMBと連携するために、RMCPのユーザを作成する必要があります。PRIMECLUSTERを構成するすべてのPRIMEQUEST3000上にRMCPでMMBを制御するためのユーザを必ず作成してください。RMCPでMMBを制御するためのユーザを作成するには、MMB Web-UIにログインし、“Network Configuration”メニューの“Remote Server Management”画面から作成します。その際、以下のようなユーザを作成してください。
- [Privilege]は「Admin」とする
- [Status]は「Enabled」とする
作成するユーザのパスワードは以下の文字以外の7ビットASCII文字で設定してください。
```
    > < " / \ = ! ? ; , &
```
RMCPでMMBを制御するためのユーザの作成方法については、本体装置添付の以下のマニュアルを参照してください。
- PRIMEQUEST 3000 シリーズ運用管理マニュアル
ここで作成したユーザ名と設定したパスワードはシャットダウン機構の設定の際に使用します。メモしてください。
注意
MMBには以下の2種類のユーザが存在します。
- MMB全体を制御するためのユーザ
- RMCPでMMBを制御するためのユーザ
ここで作成するユーザはRMCPでMMBを制御するためのユーザです。
HBA閉塞機能の設定
注意
共用ディスクを使用する場合は、本設定を必ず行ってください。
パニックが発生した場合に共用ディスクに接続しているHBAを閉塞させ、共用ディスクへのI/O処理を打ち切ります。こうすることで、共用ディスク内のデータの整合性を保ちつつ、高速に切り替えることができます。
全ノードで、共用ディスクのデバイスパス(GDSを使用している場合はGDSのデバイスパス)をHBA閉塞機能用コマンドに指定し、HBAの機能停止を行う対象として共用ディスクを追加してください。本設定は、GDSを使用している場合はGDSの設定完了後に行ってください。設定方法については、以下のマニュアルを参照してください。
- PRIMEQUEST 3000 シリーズ HBA閉塞機能説明書
I/O完了待ち時間の設定
パニックなどのノードダウンが発生しフェイルオーバする場合、共用ディスクへのI/Oの整合性を保つため、ノードダウンが発生してから新運用ノードが運用を開始するまでに、一定のI/O完了待ち時間が必要な共用ディスク装置があります。
I/O完了待ち時間の初期値として0秒を設定していますが、I/O完了待ち時間が必要な共用ディスク装置を使用している場合、この値を適切な値に設定してください。
参考
ETERNUS ディスクアレイの場合、I/O完了待ち時間が不要ですので、本設定を行う必要はありません。
本設定はCFの設定完了後に行ってください。設定方法については、“5.1.2.5.5 I/O完了待ち時間の設定”を参照してください。
注意
I/O完了待ち時間を設定した場合、パニックなどのノードダウン時の切替え時間がその時間分増加します。