7.5 運用時の注意点

PRIMECLUSTER システムの運用時の注意点について説明します。

RMS の起動中に RMS の停止を行わないでください

RMS がノード間で実行するハートビートが途切れ、RMS の停止を行ったノードが強制停止する場合があります。

RMS の停止は RMS の起動処理が完了(クラスタアプリケーションの状態遷移完了)後に実行してください。

すべてのノードの RMS を同時に停止するには hvshut -a を使用してください

すべてのノードで同時に hvshut -l を実行した場合、RMS の停止が行われず hvshut コマンドがタイムアウト、またはハングする場合があります。
すべてのノードの RMS を停止する場合は、hvshut -a をクラスタシステムを構成する任意の 1ノードで実行してください。
1 ノードごとに RMS を停止する場合は、RMS を停止するノードで hvshut -l を実行してください。

誤って、すべてのノードで同時に hvshut -l を実行し、hvshut コマンドがタイムアウトした場合は、すべてのノードを停止または再起動してください。また、hvshut コマンドがハングした場合は、hvshut -f コマンドで RMS を強制停止した後、すべてのノードを停止または再起動してください。

RMS 停止後、OS サービスの停止は行わないでください

hvshut を使用して RMS を停止しても他の PRIMECLUSTER サービス（CF、SF、CRM など）は動作しています。

このため、RMS 停止後に OS 情報（ネットワーク情報など）の修正のために OS サービスを停止／再起動すると、CF によるハートビートが失敗し予期しない切替えが発生します。

OS 情報を修正する場合は、PRIMECLUSTER のすべてのサービスを停止（CF のアンロード）した後、あるいはシングルユーザモードで行ってください。

RMS を起動する前に、RMS で使用するクラスタアプリケーションを作成してください

クラスタアプリケーションを作成しない状態で RMS を起動すると、（CML,14）のメッセージを出力し、RMS の起動に失敗します。

クラスタアプリケーションの概要と作成方法については、“第6章クラスタアプリケーションの構築”を参照してください。

クラスタを構成するノードでOSハングやスローダウンが発生した場合、正常なノードが強制停止されることがあります

クラスタを構成するノードでシステム負荷などの影響により、OSハングやスローダウンが発生した場合、CFまたはRMSがLEFTCLUSTERを検出して、シャットダウン機構がノードを強制停止します。

このとき、シャットダウン機構は生存優先度に従ってノードを強制停止するため、正常ノードが故障ノードを強制停止する前に、故障ノードのOSハングやスローダウンが解消された場合、正常ノードが先に強制停止されることがあります。

SANブート構成で全パス故障が発生した場合など、ディスク装置のシステムボリュームを参照できなくなった場合、システムの状況により、PRIMECLUSTERの異常検出機能が動作できなくなることがあります

システムボリュームを参照できないノードは動作が不定のため、以下の方法でノードをパニックさせてください。

該当ノード以外のクラスタノードにログインできる場合
sdtoolコマンドを使用して、該当ノードを停止させてください。
```
# sdtool -k <該当ノード>
```
sdtool -kで該当ノードの強制停止に失敗した場合は、「いずれのノードにもログインできない場合」の対処を実施してください。
参照
sdtoolコマンドの詳細は、“PRIMECLUSTER 活用ガイド＜コマンドリファレンス編＞”の sdtool(1M) を参照してください。
いずれのノードにもログインできない場合
運用ノードを以下の方法により、手動で強制停止してください。
- 物理環境または制御ドメインを強制停止する場合
  本体装置の取扱説明書を参照してください。
- ゲストドメインを強制停止する場合
  制御ドメインで ldm panic-domain コマンドなどを使用してください。
```
# ldm panic-domain <強制停止するゲストドメイン名>
```
- カーネルゾーンを強制停止する場合
  グローバルゾーンで zoneadm halt コマンドなどを使用してください。
```
# zoneadm -z <強制停止するカーネルゾーン名> halt
```

CIPの構成変更、起動・停止にipadmコマンドは使用しないでください

ipadmコマンドで CIPの構成変更、起動・停止をしようとするとエラーが出力され、コマンドが失敗します。

CIPの構成変更、起動・停止を行う場合は、cipconfigコマンドまたは ciptoolコマンドを使用してください。

PRIMECLUSTERのサービス状態の確認・操作にSMFのサービスコマンドを使用しないでください

PRIMECLUSTERのサービスは SMFにより管理されますが、次の2点に注意してください。

PRIMECLUSTERのサービスの状態はSMFのサービスコマンド(svcs(1) など)では確認できません。従来どおり PRIMECLUSTER システム運用画面 (Cluster Admin)や PRIMECLUSTERのコマンドにより確認してください。
PRIMECLUSTERのサービスの状態はSMFのサービス操作コマンド(svcadm(1M) など)で変更しないでください。従来どおり PRIMECLUSTER システム運用画面(Cluster Admin)や PRIMECLUSTERのコマンドを使用してください。