ページの先頭行へ戻る
PRIMECLUSTER  Cluster Foundation 導入運用手引書 4.5
FUJITSU Software

7.3.1 RCI

RCIシャットダウンエージェントは、SPARC Enterprise Mシリーズのシャットダウンエージェントです。

構成設定

RCIのハードウェアの設定は資格のあるサポート担当者のみが行います。詳細については当社技術員 (SE) にお問い合わせください。構成の詳細についてはこの他に、装置に付属のマニュアルおよびPRIMECLUSTER Release Noticesもご覧ください。

シャットダウンエージェント

RCIシャットダウンエージェントは2種類あります。

RCIログファイル

/var/opt/SMAWsf/log/SA_pprcip.log
/var/opt/SMAWsf/log/SA_pprcir.log

RCI異常を検出した場合の対処について

RCI非同期監視がRCI異常を検出した場合、RCI異常が発生したノードのみ監視/強制停止を止めますが、それ以外のノードへの監視/強制停止は続行されます。RCI非同期監視を復旧する方法は、“PRIMECLUSTER 活用ガイド<メッセージ集>”の“4.5 エラー(ERROR)メッセージ”を参照してください。以下にRCIの監視状態を確認する方法を説明します。

RCIの監視状態の確認方法

全ノードでシャットダウン機構 (SF) の状態を確認してください。

# /opt/SMAW/bin/sdtool -s

[シャットダウン機構 (SF) を開始する前に、RCI異常を検出した場合]

エージェントSA_pprcip.so、および、SA_pprcir.soのInit StateにInitFailedと表示されたノードがある場合は、そのノードとの間のRCI通信に異常があります。また、そのノードは、ノードの監視、および強制停止の対象としません。

以下の例の場合、sdtoolコマンドを実行したノードと他のすべてのノードとの間で、RCI通信に異常が発生しています。/var/adm/messagesを参照し、出力されているエラーメッセージの対処法に従い復旧してください。

# /opt/SMAW/bin/sdtool -s
Cluster Host   Agent         SA State   Shut State    Test State    Init State
------------   -----         --------   ----------    ----------    ----------
node01         SA_pprcip.so  Idle       Unknown       Unknown       InitFailed
node01         SA_pprcir.so  Idle       Unknown       Unknown       InitFailed
node02         SA_pprcip.so  Idle       Unknown       Unknown       InitFailed
node02         SA_pprcir.so  Idle       Unknown       Unknown       InitFailed
node03         SA_pprcip.so  Idle       Unknown       Unknown       InitFailed
node03         SA_pprcir.so  Idle       Unknown       Unknown       InitFailed

[シャットダウン機構 (SF) を開始した後に、RCI異常を検出した場合]

エージェントSA_pprcip.so、および、SA_pprcir.soのTest StateにUnknownやTestFailedと表示されたノードがある場合は、そのノードとの間のRCI通信に異常があります。また、そのノードは、ノードの監視、および強制停止の対象としません。

以下の例の場合、sdtoolコマンドを実行したノードとnode02との間で、RCI通信に異常が発生しています。/var/adm/messagesを参照し、出力されているエラーメッセージの対処法に従い復旧してください。

# /opt/SMAW/bin/sdtool -s
Cluster Host   Agent         SA State   Shut State    Test State    Init State
------------   -----         --------   ----------    ----------    ----------
node01         SA_pprcip.so  Idle       Unknown       TestWorked    InitWorked
node01         SA_pprcir.so  Idle       Unknown       TestWorked    InitWorked
node02         SA_pprcip.so  Idle       Unknown       TestFailed    InitWorked
node02         SA_pprcir.so  Idle       Unknown       TestFailed    InitWorked
node03         SA_pprcip.so  Idle       Unknown       TestWorked    InitWorked
node03         SA_pprcir.so  Idle       Unknown       TestWorked    InitWorked

注意

  • RCI異常を検出した場合、シャットダウン機構 (SF) を再起動するまでRCI通信が異常となる経路を用いたノードの監視、および、強制停止が行われなくなります。

  • 他のノードのRCIアドレスが、自ノードのRCIアドレスと重複している場合、7004番のエラーメッセージを出力してRCI非同期監視デーモンを異常終了します。

  • ノードの保守などでノードの電源を切断した場合、他のノードで7003番のエラーメッセージが出力されます。ノードの保守が完了しノードを起動した後に7003番のエラーメッセージの対処法を実施してください。