PRIMECLUSTER導入運用手引書 4.2 (Linux版) |
目次 索引 |
第2部 導入編 | > 第3章 ソフトウェアのインストール | > 3.1 関連ソフトウェアのインストールと設定 |
クラスタシステムを構成するノードの1つに異常が発生しクラスタシステム間のハートビートが失敗した場合、PRIMECLUSTERシャットダウン機構は異常が発生したノードの電源を強制的に切断します。
ハートビートの失敗要因がパニックであった場合、クラッシュダンプ採取中に強制電源切断すると、クラッシュダンプ採取が途中で終了してしまうため、異常原因を調査する上で必要な資料が採取できなくなる場合があります。
クラスタ高速切替機能は、上記の問題を防止するためにクラッシュダンプ採取中の強制電源切断を抑止し、同時に異常発生ノードのクラッシュダンプ採取中のフェイルオーバを実現する機能です。
使用するRHELのバージョンにより、クラッシュダンプ採取機構が異なります。
Red Hat Enterprise Linuxのバージョン |
クラッシュダンプ採取機構 |
---|---|
RHEL-AS3/RHEL-ES3 |
Netdump |
RHEL-AS3 一括修正 U05011/RHEL-ES3 一括修正 U05011 |
Netdump または Diskdump |
RHEL-AS4 一括修正 U05111 |
Diskdump |
上図に示すように、ハートビート失敗時にクラスタ高速切替機能はNetdumpサーバにパニックステータスを設定/参照します。これにより、ハートビート異常を検出したノードは、クラッシュダンプ中のノードの強制電源切断をすることなくこれを停止状態とみなし、業務を引き継ぐことが可能となります。
Netdumpサーバが停止時はクラッシュダンプ採取ができず、クラスタシステムを構成する他ノードのRSBシャットダウンエージェントから強制停止されます。
クラッシュダンプ採取中にNetdumpクライアントとNetdumpサーバ間で異常(ネットワーク障害等)が発生した場合、クラッシュダンプ採取ができず、クラスタシステムを構成する他ノードのRSBシャットダウンエージェントから強制停止されます。
クラッシュダンプ採取中にNetdumpサーバやパニックしたノードをリセットすると、クラッシュダンプ採取が正しく行われません。クラッシュダンプ採取中はリセット操作をしないでください。
パニックしたノードのクラッシュダンプ採取後の動作はNetdumpの設定に従います。
Diskdumpとの共存はできません。
Netdumpサーバはクラスタノードとは別にNetdumpサーバとして1ノード用意する必要があり、Netdumpサーバ用LAN(専用LAN)に接続する必要があります。たとえば、クラスタシステムを4ノードで構成する場合、Netdumpサーバを加えて、5ノードが必要となります。
Netdump機能を使用する場合は、事前にNetdumpサーバ、Netdumpクライアントの設定を行う必要があります。
Netdump機能の確認
Netdumpサーバ機能が利用可能となっていることを確認してください。利用可能となっていない場合は、利用可能にしてください。
確認操作はrunlevel(8)コマンドとchkconfig(8)コマンドで行います。
runlevel(8)コマンドで、現在のランレベルを確認します。
例) 以下の場合、現在のランレベルは3です。
# /sbin/runlevel
N 3
chkconfig(8)コマンドで、Netdumpサーバ機能の利用可能状態を確認します。
例) 以下の場合、現在のランレベル3のNetdumpサーバ機能はオフです。
# /sbin/chkconfig --list netdump-server
netdump-server 0:オフ 1:オフ 2:オフ 3:オフ 4:オフ 5:オフ 6:オフ
現在のランレベルでNetdumpサーバ機能がオフになっている場合、chkconfig(8)コマンドで、オンにしてください。
# /sbin/chkconfig netdump-server on
NFS機能の確認
Netdumpシャットダウンエージェントは、NFSを利用します。NFSが利用可能となっていることを確認してください。利用可能となっていない場合は、利用可能にしてください。
確認操作はrunlevel(8)コマンドとchkconfig(8)コマンドで行います。
runlevel(8)コマンドで、現在のランレベルを確認します。
例) 以下の場合、現在のランレベルは3です。
# /sbin/runlevel
N 3
chkconfig(8)コマンドで、NFS機能の利用可能状態を確認します。
例) 以下の場合、現在のランレベル3のNFS機能はオフです。
# /sbin/chkconfig --list nfs
nfs 0:オフ 1:オフ 2:オフ 3:オフ 4:オフ 5:オフ 6:オフ
現在のランレベルでNFS機能がオフになっている場合、chkconfig(8)コマンドで、オンにしてください。
# /sbin/chkconfig nfs on
リブート抑止設定
Netdumpはクラッシュダンプ採取後、ダンプ採取ノードのリブートを行います。ダンプ採取後のリブートを抑止するために "/etc/netdump.conf" に以下の設定を行います。
noreboot=true
NFS機能の設定
"/etc/exports" に以下の設定を行います。
/var/crash/log/netdump_status NodeA(ro,no_root_squash) NodeB(ro,no_root_squash)
"/var/crash/log/netdump_status" をマウント可能なノードとして、クラスタシステムを構成する全てのノードを記述してください。
NodeA, NodeBにはクラスタシステムを構成するノードのホスト名を指定してください。
例) クラスタシステムを構成するノードが NodeA, NodeB, NodeCの3ノードの場合
/var/crash/log/netdump_status NodeA(ro,no_root_squash) NodeB(ro,no_root_squash) NodeC(ro,no_root_squash)
システム再起動
システムを再起動してください。
# shutdown -r now
NFS機能の確認
NFSが利用可能となっていることを確認してください。利用可能となっていない場合は、利用可能にしてください。本操作は、クラスタシステムを構成する全てのノードで実施してください。
確認操作はrunlevel(8)コマンドとchkconfig(8)コマンドで行います。
runlevel(8)コマンドで、現在のランレベルを確認します。
例) 以下の場合、現在のランレベルは3です。
# /sbin/runlevel
N 3
chkconfig(8)コマンドで、NFS機能の利用可能状態を確認します。
例) 以下の場合、現在のランレベル3のNFS機能はオフです。
# /sbin/chkconfig --list nfs
nfs 0:オフ 1:オフ 2:オフ 3:オフ 4:オフ 5:オフ 6:オフ
現在のランレベルでNFS機能がオフになっている場合、chkconfig(8)コマンドで、オンにしてください。
# /sbin/chkconfig nfs on
NFS機能の設定
本操作は、クラスタシステムを構成する全てのノードで実施してください。
NFSマウントポイントの作成
マウントポイント(/var/crash/panicinfo)を作成します。作成は以下の方法で行ってください。
# mkdir -m 0444 -p /var/crash/panicinfo
/etc/fstabの設定
"/etc/fstab" に以下の設定を行います。
Netdump_server:/var/crash/log/netdump_status /var/crash/panicinfo nfs ro,fg,soft,noac 0 0
Netdump_server には、NetdumpサーバのIPアドレスまたはホスト名を設定します。
ホスト名を設定する場合は、"/etc/hosts" にNetdumpサーバのIPアドレスを設定してください。
例)
Node0:/var/crash/log/netdump_status /var/crash/panicinfo nfs ro,fg,soft,noac 0 0
システム再起動
システムを再起動してください。
本操作は、クラスタシステムを構成する全てのノードで実施してください。
# shutdown -r now
上図に示すように、ハートビート失敗時にクラスタ高速切替機能は RSB または BMC(Baseboard Management Controller) を利用してパニックステータスを設定/参照します。これにより、ハートビート異常を検出したノードは、クラッシュダンプ中のノードの強制電源切断をすることなくこれを停止状態とみなし、業務を引き継ぐことが可能となります。
クラッシュダンプ採取中にパニックしたノードをリセットすると、クラッシュダンプ採取が正しく行われません。クラッシュダンプ採取中はリセット操作をしないでください。
パニックしたノードのクラッシュダンプ採取後の動作はDiskdumpの設定に従います。
Netdumpとの共存はできません。
Diskdumpの設定
Diskdumpを使用する場合は、事前にDiskdumpの設定を行う必要があります。
Diskdumpの確認
Diskdumpサーバ機能が利用可能となっていることを確認してください。利用可能となっていない場合は、利用可能にしてください。
確認操作はrunlevel(8)コマンドとchkconfig(8)コマンドで行います。
runlevel(8)コマンドで、現在のランレベルを確認します。
例) 以下の場合、現在のランレベルは3です。
# /sbin/runlevel
N 3
chkconfig(8)コマンドで、Diskdumpの利用可能状態を確認します。
例) 以下の場合、現在のランレベル3のDiskdumpはオフです。
# /sbin/chkconfig --list diskdump
diskdump 0:オフ 1:オフ 2:オフ 3:オフ 4:オフ 5:オフ 6:オフ
現在のランレベルでDiskdumpがオフになっている場合、chkconfig(8)コマンドで オンにし、service コマンドで Diskdumpを起動してください。
# /sbin/chkconfig diskdump on
# /sbin/service diskdump start
Netdumpシャットダウンエージェント、あるいはDiskdumpシャットダウンエージェントの設定が完了したら、リモートサービスボード(RSB)、IPMI(Inteligent Platform Management Interface)、あるいはブレードサーバの設定を行ってください。
リモートサービスボード(RSB)のユーザ設定を行ってください。
ユーザID
パスワード
IPアドレス
詳細は、リモートサービスボード添付の取扱説明書、および "ServerView ユーザーズガイド"を参照してください。
IPMIのユーザ設定を行ってください。
ユーザID
パスワード
IPアドレス
詳細は、各機種ごとの"ユーザーズガイド"、および "ServerView ユーザーズガイド"を参照してください。
ブレードサーバの設定を行ってください。
ServerViewのインストール
SNMPコミュニティ
マネージメントブレードのIPアドレス
詳細は、"ServerViewユーザーズガイド" 、および 装置添付の各種ハードウェアガイドを参照してください。
目次 索引 |