PRIMECLUSTER システムの運用時の注意点について説明します。
RMS の起動中に RMS の停止を行わないでください
RMS がノード間で実行するハートビートが途切れ、RMS の停止を行ったノードが強制停止する場合があります。
RMS の停止は RMS の起動処理が完了(クラスタアプリケーションの状態遷移完了)後に実行してください。
すべてのノードの RMS を同時に停止するには hvshut -a を使用してください
すべてのノードで同時に hvshut -l を実行した場合、RMS の停止が行われず hvshut コマンドがタイムアウト、またはハングする場合があります。
すべてのノードの RMS を停止する場合は、hvshut -a をクラスタシステムを構成する任意の 1ノードで実行してください。
1 ノードごとに RMS を停止する場合は、RMS を停止するノードで hvshut -l を実行してください。
誤って、すべてのノードで同時に hvshut -l を実行し、hvshut コマンドがタイムアウトした場合は、すべてのノードを停止または再起動してください。また、hvshut コマンドがハングした場合は、hvshut -f コマンドで RMS を強制停止した後、すべてのノードを停止または再起動してください。
RMS 停止後、OS サービスの停止は行わないでください
hvshut を使用して RMS を停止しても他の PRIMECLUSTER サービス(CF、SF、CRM など)は動作しています。
このため、RMS 停止後に OS 情報(ネットワーク情報など)の修正のために OS サービスを停止/再起動すると、CF によるハートビートが失敗し予期しない切替えが発生します。
OS 情報を修正する場合は、PRIMECLUSTER のすべてのサービスを停止(CF のアンロード)した後、あるいはシングルユーザモードで行ってください。
RMS を起動する前に、RMS で使用するクラスタアプリケーションを作成してください
クラスタアプリケーションを作成しない状態で RMS を起動すると、(CML,14)のメッセージを出力し、RMS の起動に失敗します。
クラスタアプリケーションの概要と作成方法については、“第6章 クラスタアプリケーションの構築”を参照してください。
クラスタを構成するノードでOSハングやスローダウンが発生した場合、正常なノードが強制停止されることがあります
クラスタを構成するノードでシステム負荷などの影響により、OSハングやスローダウンが発生した場合、CFまたはRMSがLEFTCLUSTERを検出して、シャットダウン機構がノードを強制停止します。
このとき、シャットダウン機構は生存優先度に従ってノードを強制停止するため、正常ノードが故障ノードを強制停止する前に、故障ノードのOSハングやスローダウンが解消された場合、正常ノードが先に強制停止されることがあります。
SANブート構成で全パス故障が発生した場合など、ディスク装置のシステムボリュームを参照できなくなった場合、システムの状況により、PRIMECLUSTERの異常検出機能が動作できなくなることがあります
システムボリュームを参照できないノードは動作が不定のため、以下の方法でノードをパニックさせてください。
該当ノード以外のクラスタノードにログインできる場合
sdtoolコマンドを使用して、該当ノードを停止させてください。
# sdtool -k <該当ノード>
sdtool -kで該当ノードの強制停止に失敗した場合は、「いずれのノードにもログインできない場合」の対処を実施してください。
参照
sdtoolコマンドの詳細は、“PRIMECLUSTER 活用ガイド <コマンドリファレンス編>”の sdtool(1M) を参照してください。
いずれのノードにもログインできない場合
運用ノードを以下の方法により、手動で強制停止してください。
物理環境または制御ドメインを強制停止する場合
本体装置の取扱説明書を参照してください。
ゲストドメインを強制停止する場合
制御ドメインで ldm panic-domain コマンドなどを使用してください。
# ldm panic-domain <強制停止するゲストドメイン名>
カーネルゾーンを強制停止する場合
グローバルゾーンで zoneadm halt コマンドなどを使用してください。
# zoneadm -z <強制停止するカーネルゾーン名> halt
CIPの構成変更、起動・停止にipadmコマンドは使用しないでください
ipadmコマンドで CIPの構成変更、起動・停止をしようとするとエラーが出力され、コマンドが失敗します。
CIPの構成変更、起動・停止を行う場合は、cipconfigコマンドまたは ciptoolコマンドを使用してください。
PRIMECLUSTERのサービス状態の確認・操作にSMFのサービスコマンドを使用しないでください
PRIMECLUSTERのサービスは SMFにより管理されますが、次の2点に注意してください。
PRIMECLUSTERのサービスの状態はSMFのサービスコマンド(svcs(1) など)では確認できません。従来どおり PRIMECLUSTER システム運用画面 (Cluster Admin)や PRIMECLUSTERのコマンドにより確認してください。
PRIMECLUSTERのサービスの状態はSMFのサービス操作コマンド(svcadm(1M) など)で変更しないでください。従来どおり PRIMECLUSTER システム運用画面(Cluster Admin)や PRIMECLUSTERのコマンドを使用してください。