ページの先頭行へ戻る
PRIMECLUSTER 導入運用手引書 4.3

7.5 運用時の注意点

PRIMECLUSTER システムの運用時の注意点について説明します。

RMS の起動中に RMS の停止を行わないでください

RMS がノード間で実行するハートビートが途切れ、RMS の停止を行ったノードが強制停止する場合があります。

RMS の停止は RMS の起動処理が完了(クラスタアプリケーションの状態遷移完了)後に実行してください。

すべてのノードの RMS を同時に停止するには hvshut -a を使用してください

すべてのノードで同時に hvshut -l を実行した場合、RMS の停止が行われず hvshut コマンドがタイムアウト、またはハングする場合があります。
すべてのノードの RMS を停止する場合は、hvshut -a をクラスタシステムを構成する任意の 1ノードで実行してください。
1 ノードごとに RMS を停止する場合は、RMS を停止するノードで hvshut -l を実行してください。

誤って、すべてのノードで同時に hvshut -l を実行し、hvshut コマンドがタイムアウトした場合は、すべてのノードを停止または再起動してください。また、hvshut コマンドがハングした場合は、hvshut -f コマンドで RMS を強制停止した後、すべてのノードを停止または再起動してください。

RMS 停止後、OS サービスの停止は行わないでください

hvshut を使用して RMS を停止しても他の PRIMECLUSTER サービス(CF、SF、CRM など)は動作しています。

このため、RMS 停止後に OS 情報(ネットワーク情報など)の修正のために OS サービスを停止/再起動すると、CF によるハートビートが失敗し予期しない切替えが発生します。

OS 情報を修正する場合は、PRIMECLUSTER のすべてのサービスを停止(CF のアンロード)した後、あるいはシングルユーザモードで行ってください。

RMS を起動する前に、RMS で使用するクラスタアプリケーションを作成してください

クラスタアプリケーションを作成しない状態で RMS を起動すると、(CML,14)のメッセージを出力し、RMS の起動に失敗します。

クラスタアプリケーションの概要と作成方法については、“第6章 クラスタアプリケーションの構築”を参照してください。

クラスタを構成するノードでOSハングやスローダウンが発生した場合、正常なノードが強制停止されることがあります

クラスタを構成するノードでシステム負荷などの影響により、OSハングやスローダウンが発生した場合、CFまたはRMSがLEFTCLUSTERを検出して、シャットダウン機構がノードを強制停止します。

このとき、シャットダウン機構は生存優先度に従ってノードを強制停止するため、正常ノードが故障ノードを強制停止する前に、故障ノードのOSハングやスローダウンが解消された場合、正常ノードが先に強制停止されることがあります。

SANブート/iSCSIブート構成で全パス故障が発生した場合など、ディスク装置のシステムボリュームを参照できなくなった場合、システムの状況により、PRIMECLUSTERの異常検出機能が動作できなくなることがあります

システムボリュームを参照できないノードは動作が不定のため、以下の方法でノードをパニックさせてください。

該当ノード以外のクラスタノードにログインできる場合

sdtoolコマンドを使用して、該当ノードを停止させてください。

# sdtool -k <該当ノード>

参照

sdtoolコマンドの詳細は、“PRIMECLUSTER 活用ガイド <コマンドリファレンス編>”の sdtool(1M) を参照してください。

いずれのノードにもログインできない場合

運用ノードをパニックさせてください。操作方法については、本体装置の取扱説明書を参照してください。

CIPの構成変更、起動・停止にipadmコマンドは使用しないでください

ipadmコマンドで CIPの構成変更、起動・停止をしようとするとエラーが出力され、コマンドが失敗します。

CIPの構成変更、起動・停止を行う場合は、cipconfigコマンドまたは ciptoolコマンドを使用してください。

PRIMECLUSTERのサービス状態の確認・操作にSMFのサービスコマンドを使用しないでください

PRIMECLUSTERのサービスは SMFにより管理されますが、次の2点に注意してください。