ページの先頭行へ戻る
PRIMECLUSTER 導入運用手引書 4.5
FUJITSU Software

7.5 運用時の注意点

PRIMECLUSTER システムの運用時の注意点について説明します。

RMS の起動中に RMS の停止を行わないでください

RMS がノード間で実行するハートビートが途切れ、RMS の停止を行ったノードが強制停止する場合があります。

RMS の停止は RMS の起動処理が完了(クラスタアプリケーションの状態遷移完了)後に実行してください。

すべてのノードの RMS を同時に停止するには hvshut -a を使用してください

すべてのノードで同時に hvshut -l を実行した場合、RMS の停止が行われず hvshut コマンドがタイムアウト、またはハングする場合があります。
すべてのノードの RMS を停止する場合は、hvshut -a をクラスタシステムを構成する任意の 1ノードで実行してください。
1 ノードごとに RMS を停止する場合は、RMS を停止するノードで hvshut -l を実行してください。

誤って、すべてのノードで同時に hvshut -l を実行し、hvshut コマンドがタイムアウトした場合は、すべてのノードを停止または再起動してください。また、hvshut コマンドがハングした場合は、hvshut -f コマンドで RMS を強制停止した後、すべてのノードを停止または再起動してください。

RMS 停止後、OS サービスの停止は行わないでください

hvshut を使用して RMS を停止しても他の PRIMECLUSTER サービス(CF、SF、CRM など)は動作しています。

このため、RMS 停止後に OS 情報(ネットワーク情報など)の修正のために OS サービスを停止/再起動すると、CF によるハートビートが失敗し予期しない切替えが発生します。

OS 情報を修正する場合は、PRIMECLUSTER のすべてのサービスを停止(CF のアンロード)した後、あるいはシングルユーザモードで行ってください。

RMS を起動する前に、RMS で使用するクラスタアプリケーションを作成してください

クラスタアプリケーションを作成しない状態で RMS を起動すると、(CML,14)のメッセージを出力し、RMS の起動に失敗します。

クラスタアプリケーションの概要と作成方法については、“第6章 クラスタアプリケーションの構築”を参照してください。

クラスタを構成するノードでOSハングやスローダウンが発生した場合、正常なノードが強制停止されることがあります

クラスタを構成するノードでシステム負荷などの影響により、OSハングやスローダウンが発生した場合、CFまたはRMSがLEFTCLUSTERを検出して、シャットダウン機構がノードを強制停止します。

このとき、シャットダウン機構は生存優先度に従ってノードを強制停止するため、正常ノードが故障ノードを強制停止する前に、故障ノードのOSハングやスローダウンが解消された場合、正常ノードが先に強制停止されることがあります。

SANブート構成で全パス故障が発生した場合など、ディスク装置のシステムボリュームを参照できなくなった場合、システムの状況により、PRIMECLUSTERの異常検出機能が動作できなくなることがあります

システムボリュームを参照できないノードは動作が不定のため、以下の方法でノードをパニックさせてください。

CIPの構成変更、起動・停止にipadmコマンドは使用しないでください

ipadmコマンドで CIPの構成変更、起動・停止をしようとするとエラーが出力され、コマンドが失敗します。

CIPの構成変更、起動・停止を行う場合は、cipconfigコマンドまたは ciptoolコマンドを使用してください。

PRIMECLUSTERのサービス状態の確認・操作にSMFのサービスコマンドを使用しないでください

PRIMECLUSTERのサービスは SMFにより管理されますが、次の2点に注意してください。