ページの先頭行へ戻る
PRIMECLUSTER 導入運用手引書 4.6
FUJITSU Software

1.7 システム構築時の注意点

PRIMECLUSTER システム構築時に陥りやすい注意点について説明します。システムの構築を行う前に一読ください。

クラスタシステムを構成する全ノードの時刻は一致させてください

NTP サーバと接続し全ノードで時刻同期を取ってください。
全ノードの時刻が一致していない場合、クラスタが正しく動作しないことがあります。

例えば、下記のメッセージが出力されたり、クラスタアプリケーションのOnlinePriority属性を設定している場合は、RMS起動時に最後に運用系であったノードを正しく判断できず、意図したノードでクラスタアプリケーションがOnlineにならない場合があります。

(WRP, 34) Cluster host host is no longer in time sync with local node. Sane operation of RMS can no longer be guaranteed. Further out-of-sync messages will appear in the syslog.

(WRP, 35) Cluster host host is no longer in time sync with local node. Sane operation of RMS can no longer be guaranteed.

時刻同期はゆっくりと調整する必要があります

NTPを使用して各ノードの時刻を合わせる場合は、急激な時刻合わせ(stepモード)ではなく、常時ゆっくりとした時刻合わせ(slewモード)を行う必要があります。
詳細についてはOS等のマニュアルを参照してください。NTPを使用した急激な時刻合わせや、運用中のdateコマンドによる時刻合わせを行うと、ノード間で時刻不正が発生しクラスタシステムが正しく動作しません。

クラスタインタコネクトにスパニングツリープロトコルを設定しないでください

スパニングツリープロトコルを設定するとクラスタインタコネクト間のアクセスが中断し、ハートビート通信に失敗することがあります。
スイッチングハブで、STP(Spanning-Tree Protocol) の Parameter Setting - Status を Disable に設定してください。

クラスタインタコネクトの経路ではフィルタリング設定を行わないようにしてください

PRIMECLUSTER のクラスタインタコネクトでは、複数の回線を束ねた上でPRIMECLUSTER独自のプロトコル(ICFプロトコル)で通信を行っています。そのため、クラスタインタコネクトに接続されたクラスタノード以外の機器と通信を行うことができません。よって、クラスタインタコネクトの経路ではフィルタリング設定を行わないようにしてください。

クラスタで必要なカーネルパラメタは必ず設定してください

PRIMECLUSTER はシステムの資源を使用して動作します。このシステム資源が不足すると、PRIMECLUSTER が正常に動作しなくなる場合があります。

システムの使用資源量は、カーネルパラメタとして設定します。
システム資源量は動作する環境によって異なりますので動作環境より適切なシステム資源量を見積り設定してください。

なお、カーネルパラメタの変更は PRIMECLUSTER の構築前に行ってください。
また、カーネルパラメタを変更した場合は、必ずシステムを再起動してください。

参照

パラメタ値の詳細については、 PRIMECLUSTER デザインシートの“セットアップ(初期構成)”を参照してください。

システムダンプあるいはクラッシュダンプは採取できるように設定してください

システムダンプあるいはクラッシュダンプが採取できないと、トラブル発生時の調査に時間を要したり、根本原因の追求ができない場合があります。

PRIMECLUSTER を構築する前に、システムダンプあるいはクラッシュダンプが採取できることを確認してください。

使用するサーバ機種によって必要なシャットダウン機構を設定してください

使用するサーバ機種によって必要なシャットダウン機構が異なります。“5.1.2 シャットダウン機構の設定”を参照して使用するサーバ機種に必要となるシャットダウン機構を確認し、設定してください。

CF ハートビートのタイムアウト検出時間を必要に応じて設定してください

CF ハートビートのタイムアウト検出時間については、ピーク時の業務処理量を考慮し、お客様環境にあわせて設定してください。設定する値の目安は、10秒から1分程度です。デフォルト値は10秒です。

参照

CF ハートビートのタイムアウト検出時間の設定方法については、“11.3.1 CFのハートビート時間の変更”を参照してください。

RMS停止待ち時間を指定する環境変数RELIANT_SHUT_MIN_WAITは必ず設定してください

RMSとクラスタアプリケーションの停止に必要な時間は、環境によって異なるため、必ず、構成設定に応じた値を見積り、設定してください。

参照

RELIANT_SHUT_MIN_WAIT の詳細については、“PRIMECLUSTER RMS 導入運用手引書”の“E.2 RMS グローバル環境変数”を参照してください。

RMS環境変数の参照/変更方法については、“PRIMECLUSTER RMS 導入運用手引書”の“E.1 RMS 環境変数の設定”を参照してください。

シャットダウン機構の管理 LAN IP アドレスには、クラスタの運用状態に関わらず通信が可能なアドレスを設定してください

クラスタの運用状態に応じて通信の可/不可が動的に変更される IP アドレスを設定した場合、シャットダウン機構が正しく動作しません。
例えば、Global Link Services (以降、GLS) の NIC 切替方式(物理 IP アドレス引継ぎ)に設定された IP アドレスをシャットダウン機構の管理 LAN に設定した場合、GLS の起動/停止に応じて通信の可/不可が変更されるため、GLS が停止し通信が不可の場合には、シャットダウン機構が正しく動作しません。

シャットダウン機構で使用するXSCF、ILOM、またはALOMの情報を確認してください。

設定が正しくない場合、シャットダウン機構が正しく動作しません。使用するサーバ機種によって確認方法が異なります。使用するサーバ機種に従って、SPARC M10、M12の場合は“5.1.2.1.1 XSCF情報の確認”、SPARC Enterprise M3000、M4000、M5000、M8000、M9000の場合は“5.1.2.2.1 コンソール情報の確認”、SPARC Enterprise T5120、T5220、T5140、T5240、T5440、SPARC T3、T4、T5、T7、S7シリーズの場合は“5.1.2.3.1 コンソール情報の確認”、SPARC Enterprise T1000、T2000の場合は“5.1.2.4.1 コンソール情報の確認”を参照してください。また、Oracle Solaris カーネルゾーン環境の場合は、“5.1.2.5.1 XSCF情報の確認”または“5.1.2.5.2 ILOM情報の確認”を参照してください。

通常運用時のモードスイッチは、SPARC Enterprise Mx000の場合は、Lockedに設定してください。

モードスイッチが適切に設定されていない場合、SA_pprcirによる強制停止が失敗します。

パトロール診断を行うハードウェアとして共用ディスク装置を指定する場合、共用ディスク装置の物理ディスク名がすべてのノードで同じになるように設定してください。

共用ディスク装置の物理ディスク名がノードごとに異なる場合、パトロール診断を行うハードウェアとして共用ディスク装置を設定することはできません。