ここでは、シャットダウン構成ウィザードを使用してシャットダウン機構を設定する手順について説明します。
シャットダウン機構の設定手順は、機種により異なります。ハードウェアの機種を確認して適切なシャットダウンエージェントを設定してください。
以下に機種により必要なシャットダウンエージェントを示します。
サーバ機種名 | XSCF SNMP | RCI | XSCF | ALOM | ILOM | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Panic | Reset | PPAR Reset | Panic | Reset | Panic | Reset | Break | Break | Panic | Reset | ||||
SPARC Servers | SPARC M10 | ○ | ○ | ○ | × | × | × | × | × | × | × | × | ||
SPARC | M3000 | 日本 | 富士通提供 | × | × | × | ○ | ○ | ○ | ○ | ○ | × | × | × |
他社 | × | × | × | × | × | ○ | ○ | ○ | × | × | × | |||
日本 | × | × | × | × | × | ○ | ○ | ○ | × | × | × | |||
T1000 | × | × | × | × | × | × | × | × | ○ | × | × | |||
T5120 | × | × | × | × | × | × | × | × | × | ○ | ○ (*1) | |||
SPARC | T3シリーズ | × | × | × | × | × | × | × | × | × | ○ | ○ |
(*1) ILOM Resetを使用する場合、SPARC Enterprise本体装置用ファームウェアのSystem Firmware 7.1.6.d以降が必要です。
以下に仮想化環境で必要なシャットダウンエージェントを示します。
サーバ機種名 | XSCF SNMP | ILOM | ||||||
---|---|---|---|---|---|---|---|---|
制御ドメイン | ゲストドメイン | 制御ドメイン | ||||||
Panic | Reset | PPAR Reset | Panic | Reset | Panic | Reset | ||
SPARC | SPARC M10 | ○ | ○ | ○ | ○ | ○ | × | × |
SPARC | T3シリーズ | × | × | × | × | × | ○ | ○ |
注意
以下のいずれかのシャットダウンエージェントを使用して、シャットダウン機構を動作させている際は、コンソールを使用しないでください。
XSCF Panic
XSCF Reset
XSCF Break
ILOM Panic
ILOM Reset
やむを得ずコンソールを使用する場合は、事前に全ノードのシャットダウン機構を停止させてください。コンソールの使用後、コンソールの接続を切断してから、全ノードのシャットダウン機構を起動し、状態が正常であることを確認してください。シャットダウン機構の停止、起動、状態確認については、“PRIMECLUSTER 活用ガイド<コマンドリファレンス編>”の sdtool(1M) を参照してください。
/etc/inet/hostsファイルには、シャットダウン機構で使用する管理LANのIPアドレスとホスト名を、全ノード分記載する必要があります。全ノードのIPアドレスとホスト名が記載されていることを確認してください。
RCI非同期監視を行う場合、SCF/RCI経由での監視タイムアウト時間(カーネルパラメタ)を/etc/system に設定する必要があります。カーネルパラメタの設定については、“A.5.1 CF 構成の場合”を参照してください。
クラスタシステム運用中に、突然ノードのAC電源が切断された場合、PRIMECLUSTERは電源切断されたノードをLEFTCLUSTER状態にした後で、コンソールを切断することがあります。この場合、ノードの電源が実際に切断されていることを確認してから、cftool -kコマンドによりLEFTCLUSTER状態を解除してください。その後、コンソールを再接続し、ノードに電源を投入してください。
SCF/RCIが故障している、または、RCIケーブルが切断されているなどのハード異常や、重複するRCIアドレスの設定を検出した場合、それらの状態がsdtool -sの表示またはシャットダウン機構の構成状態の表示画面に反映されるまで、最大10分(異常を検出した、もしくはシャットダウン機構を起動してからの時間)かかります。
シャットダウンエージェント設定後は、正しいノードが強制停止できることを確認するため、クラスタノード強制停止テストを実施してください。クラスタノード強制停止テストの詳細については、“1.4 テスト”を参照してください。
Oracle VM Server for SPARCのマイグレーション機能を使用する場合は、“第14章 Oracle VM Server for SPARC環境でマイグレーション機能を使用する場合”を参照してください。
シャットダウン機構に使用する管理LANをGLSで二重化する場合は、NIC切替方式の論理IPアドレス引継ぎ機能を使用し、シャットダウン機構の管理LANには物理IPアドレスを設定してください。
参照
シャットダウン機構と非同期監視の機能の詳細は、以下のマニュアルを参照してください。
“PRIMECLUSTER コンセプトガイド”の“3.3.1.7 PRIMECLUSTER SF”
“PRIMECLUSTER Cluster Foundation 導入運用手引書”の“8 シャットダウン機構”
シャットダウン機構のSNMP非同期監視機能ではXSCFを利用します。
XSCF への接続方法は、 SSH または telnet から選択することができます。デフォルトは SSH となります。
シャットダウン機構の設定をする前に、以下の設定を確認してください。
共通
シャットダウン機構用にログインユーザアカウントが root 以外で作成され、かつ、platadm 権限を付与されていること
制御ドメインで論理ドメインの構成情報を保存して、XSCFでshowdomainstatusコマンドを実行し、クラスタを構築する論理ドメインの状態が表示されること
SSH 接続する場合
XSCF において、外部からの接続許可プロトコル種別で SSH が有効になっていること
シャットダウン機構用のログインユーザアカウントを使用して、全てのクラスタノードから XSCF へ SSH 接続し、SSH初回接続時のユーザ問い合わせ (RSA鍵の生成など) が完了していること
例
シャットダウン機構用のログインユーザアカウントが“user001”、自クラスタノードの/etc/inet/hostsに登録されているXSCF-LAN#0のホスト名が“XSCF1”、XSCF-LAN#1のホスト名が“XSCF2”、他クラスタノードの/etc/inet/hostsに登録されているXSCF-LAN#0のホスト名が“XSCF3”、XSCF-LAN#1のホスト名が“XSCF4”の場合
# ssh -l user001 XSCF1 The authenticity of host 'XSCF1 (XXX.XXX.XXX.XXX)' can't be established. RSA key fingerprint is xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx. Are you sure you want to continue connecting (yes/no)? yes ←yes と入力
# ssh -l user001 XSCF2 The authenticity of host 'XSCF2 (XXX.XXX.XXX.XXX)' can't be established. RSA key fingerprint is xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx. Are you sure you want to continue connecting (yes/no)? yes ←yes と入力
# ssh -l user001 XSCF3 The authenticity of host 'XSCF3 (XXX.XXX.XXX.XXX)' can't be established. RSA key fingerprint is xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx. Are you sure you want to continue connecting (yes/no)? yes ←yes と入力
# ssh -l user001 XSCF4 The authenticity of host 'XSCF4 (XXX.XXX.XXX.XXX)' can't be established. RSA key fingerprint is xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx:xx. Are you sure you want to continue connecting (yes/no)? yes ←yes と入力
telnet 接続する場合
XSCF において、外部からの接続許可プロトコル種別で telnet が有効になっていること
注意
XSCF への接続がシリアルポート接続のみの場合、シャットダウン機構ではサポートされません。XSCF-LAN を使用した SSH 接続、またはtelnet 接続のいずれかを使用してください。
また、XSCFに関する以下の情報をメモしてください。
XSCF のIPアドレス(*1)、または、ノードの/etc/inet/hostsに登録されているXSCFのホスト名
XSCF においての、シャットダウン機構用のログインユーザアカウントとパスワード
*1) ネットワークルーティングが設定されている場合は、XSCF の IP アドレスがクラスタノードの管理 LAN と同一セグメントである必要はありません。
参照
XSCFの設定方法、確認方法については、“SPARC M10 システム システム運用・管理ガイド”を参照してください。
SNMP非同期監視機能を使用するためのSNMPに関する各種設定を行います。
注意
以下の場合、SNMPに関するポート番号を変更する必要があります。詳細は“8.13 SNMPに関するポート番号の変更”を参照してください。
SPARC M10環境で以下の製品と組み合わせて使用する場合
Systemwalker Centric Manager
Systemwalker Network Manager
ETERNUS SF Storage Cruiser
OSのSNMPトラップ受信デーモン(snmptrapd)のポート番号が他製品のポート番号と重複している場合
■XSCF のSNMP エージェントに関連する設定
クラスタを構成する全てのXSCFでSNMPエージェントの設定を行います。
showsnmp コマンドを実行し、SNMP 設定を表示します。
XSCF> showsnmp
setsnmp コマンドを実行し、トラップの設定を行います。
XSCF> setsnmp addtraphost -t v2 -s FJSVcldev [管理LANのIPアドレス] XSCF> setsnmp addtraphost -t v2 -s FJSVcldev [非同期監視サブLANのIPアドレス]
例
node1のXSCFの場合
XSCF> setsnmp addtraphost -t v2 -s FJSVcldev [node1の管理LANのIPアドレス] XSCF> setsnmp addtraphost -t v2 -s FJSVcldev [node1の非同期監視サブLANのIPアドレス] XSCF> setsnmp addtraphost -t v2 -s FJSVcldev [node2の管理LANのIPアドレス] XSCF> setsnmp addtraphost -t v2 -s FJSVcldev [node2の非同期監視サブLANのIPアドレス]
node2のXSCFの場合
XSCF> setsnmp addtraphost -t v2 -s FJSVcldev [node1の管理LANのIPアドレス] XSCF> setsnmp addtraphost -t v2 -s FJSVcldev [node1の非同期監視サブLANのIPアドレス] XSCF> setsnmp addtraphost -t v2 -s FJSVcldev [node2の管理LANのIPアドレス] XSCF> setsnmp addtraphost -t v2 -s FJSVcldev [node2の非同期監視サブLANのIPアドレス]
setsnmp コマンドを実行し、SNMP エージェントを有効にします。
XSCF> setsnmp enable
showsnmp コマンドを実行し、設定が有効になっているかを確認します。
XSCF> showsnmp
参照
XSCFのSNMP エージェントに関連する設定方法、確認方法については、“SPARC M10 システム システム運用・管理ガイド”を参照してください。
■シャットダウン構成ウィザードの起動
Cluster Admin 画面のCFメインウィンドウで、[ツール]メニューの [シャットダウン機構]-[設定ウィザード] を選択してシャットダウン構成ウィザードを起動します。
注意
シャットダウン機構の設定は、CFウィザードでCF構成の設定を完了したあと、続けて行うこともできます。
以下の確認ポップアップ画面が表示されるので、<はい>をクリックすると、シャットダウン構成ウィザードが起動します。
■設定方法の選択
シャットダウン機構の設定方法は、以下の2種類を選択することができます。
簡単な設定(推奨)
詳細な設定
ここでは、「簡単な設定(推奨)」を使用した設定について説明します。この方法では、推奨されているPRIMECLUSTERのシャットダウン機構の構成を流れに沿って設定できます。
図5.1 設定方法の選択
「簡単な設定(推奨)」 を選択して、<次へ>をクリックします。
■シャットダウンエージェントの選択
シャットダウンエージェントの選択画面が表示されます。
ハードウェアの機種を確認して、適切なシャットダウンエージェントを選択します。
SPARC M10の場合
[XSCF(SPARC M10)]を選択します。
以下のシャットダウンエージェントが自動で設定されます。
制御ドメイン間のクラスタシステムの場合
XSCF SNMP Panic XSCF-LAN#0(ドメイン)
XSCF SNMP Panic XSCF-LAN#1(ドメイン)
XSCF SNMP Reset XSCF-LAN#0(ドメイン)
XSCF SNMP Reset XSCF-LAN#1(ドメイン)
XSCF SNMP Reset XSCF-LAN#0(PPAR)
XSCF SNMP Reset XSCF-LAN#1(PPAR)
ゲストドメイン間のクラスタシステムの場合
XSCF SNMP Panic XSCF-LAN#0(ドメイン)
XSCF SNMP Panic XSCF-LAN#1(ドメイン)
XSCF SNMP Reset XSCF-LAN#0(ドメイン)
XSCF SNMP Reset XSCF-LAN#1(ドメイン)
選択後、<次へ>をクリックします。
参考
シャットダウンエージェントを選択すると、以下のタイムアウト値が自動で設定されます。
タイムアウト値 = 20(秒)
■XSCFの設定
XSCFの情報を入力する画面が表示されます。
“5.1.2.1.1 XSCF情報の確認”でメモしておいたXSCFに関する情報を設定します。
PPAR-IDを入力します。
ドメイン名を入力します。
制御ドメインの場合は、“primary”を入力します。
XSCF-LAN#0のIPアドレスまたは/etc/inet/hostsに登録されているホスト名を入力します。
指定可能なアドレス形式は、IPv4アドレスです。
XSCF-LAN#1のIPアドレスまたは/etc/inet/hostsに登録されているホスト名を入力します。
指定可能なアドレス形式は、IPv4アドレスです。
XSCFへログインするためのユーザ名を入力します。
XSCFへログインするためのパスワードを入力します。
注意
XSCFが二重化された環境の場合、XSCFのユーザ名とパスワードの組合せは、2台で同一にしてください。
マイグレーション機能を使用する場合、XSCFのユーザ名とパスワードの組合せ、およびXSCFへの接続方法は、すべてのノードで同一にしてください。
設定終了後、<次へ>をクリックします。
■ノードの重みと管理LAN IPアドレスの設定
ノードの重みと管理LAN IPアドレスを設定する画面が表示されます。
ノードの重みと管理LAN IPアドレスを設定します。
クラスタを構成するノードの重みを入力します。重みは、クラスタパーティションが発生した場合に生存するノード群の生存優先度の特定に使用されます。各ノードに対して入力できる値は1 ~ 300 です。
生存優先度と重みについては下の説明を参照してください。
直接IP アドレスを入力するか、またはタブをクリックして管理LAN のIP アドレスに割り当てられたホスト名をセットします。
指定可能なアドレス形式は、IPv4アドレスおよびIPv6アドレスです。
IPv6のリンクローカルアドレスは使用できません。
設定終了後、<次へ>をクリックします。
◆生存優先度
クラスタインタコネクトの障害によりクラスタパーティションが発生した場合、まだ全ノードがユーザ資産にアクセスできる状態にあります。クラスタパーティションについては、“PRIMECLUSTER コンセプトガイド”の“2.2.2.1 データ整合性の保証”を参照してください。
ユーザ資産であるデータの整合性を保証するために、生存させるノード群と強制停止させるノード群を決定する必要があります。
PRIMECLUSTERでは、それぞれのノード群に対する重み付けを「生存優先度」と呼んでいます。
ノードの重みが大きいほど生存優先度は高くなり、小さくなるにつれて生存優先度は低くなります。ノード群の生存優先度が同じ場合は、ノード名がアルファベット順で最も早いノードを含むノード群が生存します。
生存優先度は、以下の計算で求められます。
生存優先度=SFのノードの重み(weight)+userApplicationの ShutdownPriority
ノードの重み。デフォルト値=1。シャットダウン機構の設定の際に指定します。
設定はuserApplication作成時の属性設定で行ってください。設定値の変更方法については、“8.1.2 クラスタアプリケーションの運用属性の変更”を参照してください。
参照
userApplicationのShutdownPriority属性については、“6.7.5 属性の説明”を参照してください。
◆生存優先度の設計指針
以下に、代表的なケースをもとに、生存優先度の設計指針を示します。
[最も多くのノードを生存させたい場合]
全てのノードのweightを1(デフォルト)に設定
全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定
[特定のノードを生存させたい場合]
生存させるノードのweightをその他ノードのweightの合計の2倍以上の値に設定
全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定
以下は、node1を生存させる場合の例です。
[特定のアプリケーションが動作しているノードを生存させたい場合]
全てのノードのweightを1(デフォルト)に設定
動作を続けさせるユーザアプリケーションのShutdownPriority属性をその他のユーザアプリケーションのShutdownPriority属性と全てのノードのweightの合計の2倍以上の値に設定
以下は、app1が動作しているノードを生存させる場合の例です。
[制御ドメイン間のクラスタシステムとゲストドメイン間のクラスタシステムを組み合わせ、特定の制御ドメインを生存させたい場合(推奨)]
各クラスタシステムにおいて、生存優先度の低い順に、ノードのweightを2のべき乗(1,2,4,8,16,...)の値に設定
ゲストドメインに設定するweightは、対応する制御ドメインと順序関係が同じになるようにする
例えば、制御ドメイン間でhost1の生存優先度をhost2より高くするとき、ゲストドメイン間でnode1(host1に対応)の生存優先度をnode2~4(host2に対応)より高く設定
全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定
以下は、node1、node2、node3、node4の順番でノードを生存させる場合の例です。
[制御ドメイン間のクラスタシステムとゲストドメイン間のクラスタシステムを組み合わせ、最も多くの制御ドメインを生存させたい場合]
注意
物理パーティションがリセットされた場合、ゲストドメイン間のクラスタシステムの業務が停止する可能性があるため、注意してください。
本設定を行う場合、I/Oルートドメインを作成しておく必要があります。
制御ドメインのノードのweightを1(デフォルト)に設定
制御ドメインのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定
ゲストドメインのノードには[特定のノードを生存させたい場合]を設定、または[特定のアプリケーションが動作しているノードを生存させたい場合]を設定
以下は、ゲストドメインに[特定のノードを生存させたい場合]の設定を行った場合の例です。
この場合、ゲストドメイン間クラスタ1では、node11を生存ノードとしてnode12を強制停止しますが、制御ドメイン間クラスタでは、node2とnode3を生存ノードとしてnode1を強制停止します。node1の強制停止により、筐体0の物理パーティションがリセットされた場合、ゲストドメイン間クラスタ1の業務が停止してしまうため、注意してください。
■設定の保存
設定内容を確認して、保存します。
ウィンドウの左パネルにはクラスタを構成するノードが表示され、各ノードに対して構成されたシャットダウンエージェントが表示されます。
<次へ>をクリックすると、確認ポップアップ画面が表示されます。
<はい>を選択して設定を保存します。
■シャットダウン機構の構成状態の表示
設定を保存すると、シャットダウン機構の構成状態の表示画面が表示されます。この画面では、状態を表示するノードを選択することにより、各ノードのシャットダウン機構の構成状態を確認することができます。
参考
シャットダウン機構の構成状態は、Cluster AdminのCFメインウィンドウで、[ツール]メニューの [シャットダウン機構]-[状態の表示]を選択しても表示することができます。
通常のシステム運用時にはUnknown と表示されており、ノードに異常が発生し、シャットダウン機構がノードの停止に成功すると、KillWorked に変わります。
ノード異常発生時にノードを停止させる経路をテストした状態を表しています。経路のテストが完了していない時はUnknown と表示されますが、構成されたシャットダウンエージェントが正常に動作した場合、TestWorked に変わります。
シャットダウンエージェントを初期化した状態を表しています。
構成ウィザードを終了する時は、<完了>をクリックするとポップアップ画面が表示されますので、<はい>をクリックします。
注意
この画面でシャットダウン機構が正常に動作していることを確認してください。
テスト状態にTestFailedと表示された場合は、論理ドメインの構成情報が保存されていない可能性があります。論理ドメインの構成情報を保存していない場合は、ldm add-spconfigコマンドを使用して論理ドメインの構成情報を保存してください。
シャットダウン機構の設定が完了しているのに、初期状態がInitFailed と表示されたり、テスト状態にUnknown や赤字でTestFailed と表示された場合は、エージェントやハードウェアの構成設定に誤りがある可能性があります。/var/adm/messagesファイルとコンソール出力画面にエラーメッセージが出力されていないか確認してください。その後、出力されたメッセージの内容に対応した対処を実施します。
XSCFへの接続方法がtelnet接続の場合、この時点でテスト状態はTestFailed となります。“5.1.2.1.4 XSCFへの接続方法の設定”を実施後、シャットダウン機構が正常に動作していることを確認してください。
参照
エラーメッセージの対処方法については、以下のマニュアルを参照してください。
“PRIMECLUSTER Cluster Foundation 導入運用手引書”の“11.12 非同期監視メッセージ”
■SNMPトラップの受信確認
クラスタを構成する全てのXSCFについて、SNMPトラップの受信を確認します。
XSCFで以下のコマンドを実行します。
擬似エラー通知トラップが発行されます。
XSCF> rastest -c test
全ノードで、/var/adm/messagesファイルに、XSCFの管理LANと非同期監視サブLANの二つのIPアドレスについて疑似エラー通知トラップが出力されることを確認してください。非同期監視サブLANを利用しない構成の場合は、管理LANのIPアドレスについてのみ出力されます。“FF020001”と“M10-Testalert”の単語を含むメッセージが出力された場合は、SNMPトラップの受信に成功しています。
例:XSCFのIPアドレスが“192.168.10.10”の場合
snmptrapd[プロセスID]: [ID 702911 daemon.warning] 192.168.10.10 [192.168.10.10]: Trap DISMAN-EVENT-MIB::sysUpTimeInstance = Timeticks: (3557) 0:00:35.57, SNMPv2-MIB::snmpTrapOID.0 = OID: SNMPv2-SMI::enterprises.211.1.15.4.1.2.0.1, SNMPv2-SMI::enterprises.211.1.15.4.1.1.12.2.1.13.100.0.254.0.254.0 = INTEGER: 3, SNMPv2-SMI::enterprises.211.1.15.4.1.2.1.2.0 = INTEGER: 1, SNMPv2-SMI::enterprises.211.1.15.4.1.1.4.3.0 = STRING: "PZ31426053", SNMPv2-SMI::enterprises.211.1.15.4.1.1.4.2.0 = STRING: "SPARC M10-1", SNMPv2-SMI::enterprises.211.1.15.4.1.1.4.1.0 = "", SNMPv2-SMI::enterprises.211.1.15.4.1.2.1.14.0 = STRING: "FF020001", SNMPv2-SMI::enterprises.211.1.15.4.1.2.1.15.0 = STRING: "Oct 27 10:54:34.288 JST 2014", SNMPv2-SMI::enterprises.211.1.15.4.1.2.1.16.0 = STRING: "https://support.oracle.com/msg/M10-Testalert <https://support.oracle.com/msg/M10-Testalert>", SNMPv2-SMI::enterprises.211.1.15.4.1.2.1.17.0 = STRING: "TZ1422A010 ", SNMPv2-SMI::enterprises.211.1.15.4.1.2.1.18.0 = STRING: "CA07363-D011
疑似エラー通知トラップが出力されない場合は、SNMPの設定に誤りがある可能性があります。“5.1.2.1.2 SNMPの設定”を見直してください。
参照
擬似エラー通知トラップの内容については、“SPARC M10 システム XSCF MIB・Trap一覧”を参照してください。
SPARC M10では、XSCFへの接続方法のデフォルトはSSH接続です。
telnet接続に変更する場合は以下の手順で行います。
■接続方法の変更
全ノードで以下のコマンドを実行し、接続方法を変更します。
# /etc/opt/FJSVcluster/bin/clsnmpsetup -m -t telnet
接続方法の変更後は、clsnmpsetup -lコマンドを実行し、connection-type にtelnetが表示されていることを確認してください。
# /etc/opt/FJSVcluster/bin/clsnmpsetup -l device-name cluster-host-name PPAR-ID domain-name IP-address1 IP-address2 user-name connection-type ------------------------------------------------------------------------------------------------- xscf node1 1 primary xscf11 xscf12 xuser telnet xscf node2 2 primary xscf21 xscf22 xuser telnet
注意
マイグレーション機能を使用する場合、XSCFのユーザ名とパスワードの組合せ、およびXSCFへの接続方法は、すべてのノードで同一にしてください。
■シャットダウン機構の起動
各ノードで以下のコマンドを実行し、シャットダウン機構が起動済か確認してください。
# /opt/SMAW/bin/sdtool -s
シャットダウン機構の構成状態が表示された場合、シャットダウン機構は起動済です。
“The RCSD is not running”が表示された場合、シャットダウン機構は起動されていません。
シャットダウン機構が起動済の場合、以下のコマンドを実行し、シャットダウン機構を再起動してください。
# /opt/SMAW/bin/sdtool -r
シャットダウン機構が起動していない場合、以下のコマンドを実行し、シャットダウン機構を起動してください。
# /opt/SMAW/bin/sdtool -b
SPARC Enterprise M3000、M4000、M5000、M8000、M9000 では、XSCF を使用します。シャットダウン機構のコンソール非同期監視機能としての XSCF への接続方法は、 SSH または telnet から選択することができます。デフォルトは SSH となります。
シャットダウン機構の設定をする前に、XSCF に関する以下の設定を確認してください。
共通
シャットダウン機構用にログインユーザアカウントが root 以外で作成され、かつ、platadm 権限を付与されていること
SSH 接続する場合
XSCF において、外部からの接続許可プロトコル種別で SSH が有効になっていること
シャットダウン機構用のログインユーザアカウントを使用して、全てのクラスタノードから XSCF へ SSH 接続し、SSH初回接続時のユーザ問い合わせ (RSA鍵の生成など) が完了していること
telnet 接続する場合
XSCF において、外部からの接続許可プロトコル種別で telnet が有効になっていること
注意
XSCF への接続がシリアルポート接続のみの場合、シャットダウン機構ではサポートされません。XSCF-LAN を使用した SSH 接続、またはtelnet 接続 のいずれかを使用してください。
また、XSCFに関する以下の情報をメモしてください。
XSCF のIPアドレス(*1)、または、ノードの/etc/inet/hostsに登録されているXSCFのホスト名
XSCF においての、シャットダウン機構用のログインユーザアカウントとパスワード
*1) ネットワークルーティングが設定されている場合は、XSCF の IP アドレスがクラスタノードの管理 LAN と同一セグメントである必要はありません。
参照
XSCFの設定方法、確認方法については、“XSCFユーザーズガイド”を参照してください。
ハードウェアの機種により、必要なシャットダウンエージェントが異なります。
以下に示す、ハードウェアの機種とシャットダウンエージェントの組み合わせを確認してください。
日本で他社が提供したSPARC Enterprise M3000、M4000、M5000、M8000、M9000の場合、または
日本以外で富士通・Oracle両社のロゴを配した筐体のSPARC Enterprise M3000、M4000、M5000、M8000、M9000の場合
XSCF Panic
XSCF Break
XSCF Reset
上記以外のSPARC Enterprise M3000、M4000、M5000、M8000、M9000の場合
RCI Panic
XSCF Panic
XSCF Break
RCI Reset
XSCF Reset
■RCI非同期監視の動作環境の設定
本設定は、以下の場合のみ必要です。
日本で富士通が提供したSPARC Enterprise M3000、M4000、M5000、M8000、M9000の場合
RCI非同期監視を行う場合、SCF/RCI経由での監視タイムアウト時間(カーネルパラメタ)をetc/system に設定する必要があります。
参照
カーネルパラメタの設定については、“A.5.1 CF 構成の場合”を参照してください。
注意
変更した値を有効にするには、システムを再起動する必要があります。
■シャットダウン構成ウィザードの起動
Cluster Admin 画面のCFメインウィンドウで、[ツール]メニューの [シャットダウン機構]-[設定ウィザード] を選択して、シャットダウン構成ウィザードを起動します。
注意
シャットダウン機構の設定は、CFウィザードでCF構成の設定を完了したあと、続けて行うこともできます。
以下の確認ポップアップ画面が表示されるので、<はい>をクリックすると、シャットダウン構成ウィザードが起動します。
■設定方法の選択
シャットダウン機構の設定方法は、以下の2種類を選択することができます。
簡単な設定(推奨)
詳細な設定
ここでは、「簡単な設定(推奨)」を使用した設定について説明します。この方法では、推奨されているPRIMECLUSTERのシャットダウン機構の構成を流れに沿って設定できます。
図5.2 設定方法の選択
「簡単な設定(推奨)」 を選択して、<次へ>をクリックします。
■シャットダウンエージェントの選択
シャットダウンエージェントの選択画面が表示されます。
図5.3 シャットダウンエージェントの選択
ハードウェアの機種を確認して、適切なシャットダウンエージェントを選択します。
日本で他社が提供したSPARC Enterprise M3000、M4000、M5000、M8000、M9000の場合、または
日本以外で富士通・Oracle両社のロゴを配した筐体のSPARC Enterprise M3000、M4000、M5000、M8000、M9000の場合
上記以外のSPARC Enterprise M3000、M4000、M5000、M8000、M9000の場合
[XSCF(SPARC Enterprise Mシリーズ)]を選択します。
[XSCF(SPARC Enterprise Mシリーズ)]を選択すると、[RCIも使用する]が表示されるため、[RCIも使用する]のチェックを外してください。
以下のシャットダウンエージェントが自動で設定されます。
XSCF Panic
XSCF Break
XSCF Reset
チェックを外した後、<次へ>をクリックします。
[XSCF(SPARC Enterprise Mシリーズ)]を選択します。
[XSCF(SPARC Enterprise Mシリーズ)]を選択すると、[RCIも使用する]が表示されますが、[RCIも使用する]のチェックは外さないでください。
以下のシャットダウンエージェントが自動で設定されます。
RCI Panic
XSCF Panic
XSCF Break
RCI Reset
XSCF Reset
[XSCF(SPARC Enterprise Mシリーズ)]を選択後、<次へ>をクリックします。
参考
シャットダウンエージェントを選択すると、タイムアウト値が自動で設定されます。
XSCF Panic/XSCF Breakの場合
4ノード以下
タイムアウト値 = 20 (秒)
5ノード以上
タイムアウト値 = 6 x クラスタノード数 + 2 (秒)
例)5ノードの場合: 6 x 5 + 2 = 32 (秒)
XSCF Resetの場合
4ノード以下
タイムアウト値 = 40 (秒)
5ノード以上
タイムアウト値 = 6 x クラスタノード数 + 22 (秒)
例)5ノードの場合: 6 x 5 + 22 = 52 (秒)
RCI Panic/RCI Resetの場合
タイムアウト値 = 20 (秒)
■XSCFの設定
XSCFの情報を入力する画面が表示されます。
図5.4 XSCFのIPアドレス数の選択
シャットダウン機構で利用するXSCFのIPアドレス数を選択します。
注意
XSCFユニットを二重化して、XSCF-LANを二重化していない場合、XSCFのIPアドレス数は [1] になります。この場合、XSCFのIPアドレスには、仮想IP(引継ぎIPアドレス)を指定します。
XSCFのIPアドレス数を選択した後、<次へ>をクリックします。
XSCFの情報を設定する画面が表示されます。
以下に、「a) XSCFのIPアドレス数に[1]を選択した場合」と、「b) XSCFのIPアドレス数に[2]を選択した場合」について、それぞれ説明します。
“5.1.2.2.1 コンソール情報の確認”でメモしておいたXSCFに関する情報を設定します。
XSCFのIPアドレスまたは/etc/inet/hostsに登録されているXSCFのホスト名を入力します。
指定可能なアドレス形式は、IPv4アドレスです。
XSCFへログインするためのユーザ名を入力します。
XSCFへログインするためのパスワードを入力します。
設定終了後、<次へ>をクリックします。
“5.1.2.2.1 コンソール情報の確認”でメモしておいたXSCFに関する情報を設定します。
XSCF-LAN#0のIPアドレスまたは/etc/inet/hostsに登録されているホスト名を入力します。
指定可能なアドレス形式は、IPv4アドレスです。
XSCF-LAN#1のIPアドレスまたは/etc/inet/hostsに登録されているホスト名を入力します。
指定可能なアドレス形式は、IPv4アドレスです。
XSCFへログインするためのユーザ名を入力します。
XSCFへログインするためのパスワードを入力します。
注意
XSCFのユーザ名とパスワードの組合せは、2台で同一にしてください。
設定終了後、<次へ>をクリックします。
■Wait for PROMの設定
注意
[Wait for PROM]は未サポート機能であるため、チェックボックスのチェックは不要です。
[次へ]ボタンをクリックしてください。
図5.5 Wait for PROMの設定
■ハードウェア選択の設定
シャットダウンエージェントに [XSCF(SPARC Enterprise Mシリーズ)] を選択した場合は、ハードウェアを選択する画面が表示されます。
適切なハードウェアを選択してください。
図5.6 ハードウェア選択の設定
日本で他社が提供したSPARC Enterprise M3000、M4000、M5000、M8000、M9000の場合
[日本国内で富士通以外が提供したハードウェア]を選択します。
日本以外で富士通・Oracle両社のロゴを配した筐体のSPARC Enterprise M3000、M4000、M5000、M8000、M9000の場合
[日本国外で富士通・Oracle両社のロゴを配したハードウェア]を選択します。
上記以外のSPARC Enterprise M3000、M4000、M5000、M8000、M9000の場合
[上記以外]を選択します。
設定終了後、<次へ>をクリックします。
■ノードの重みと管理LAN IPアドレスの設定
ノードの重みと管理LAN IPアドレスを設定する画面が表示されます。
図5.7 ノードの重みと管理LAN IPアドレスの設定
ノードの重みと管理LAN IPアドレスを設定します。
クラスタを構成するノードの重みを入力します。重みは、クラスタパーティションが発生した場合に生存するノード群の生存優先度の特定に使用されます。各ノードに対して入力できる値は1 ~ 300 です。
生存優先度と重みについては下の説明を参照してください。
直接IP アドレスを入力するか、またはタブをクリックして管理LAN のIP アドレスに割り当てられたホスト名をセットします。
指定可能なアドレス形式は、IPv4アドレスおよびIPv6アドレスです。
IPv6のリンクローカルアドレスは使用できません。
設定終了後、<次へ>をクリックします。
◆生存優先度
クラスタインタコネクトの障害によりクラスタパーティションが発生した場合、まだ全ノードがユーザ資産にアクセスできる状態にあります。クラスタパーティションについては、“PRIMECLUSTER コンセプトガイド”の“2.2.2.1 データ整合性の保証”を参照してください。
ユーザ資産であるデータの整合性を保証するために、生存させるノード群と強制停止させるノード群を決定する必要があります。
PRIMECLUSTERでは、それぞれのノード群に対する重み付けを「生存優先度」と呼んでいます。
ノードの重みが大きいほど生存優先度は高くなり、小さくなるにつれて生存優先度は低くなります。ノード群の生存優先度が同じ場合は、ノード名がアルファベット順で最も早いノードを含むノード群が生存します。
生存優先度は、以下の計算で求められます。
生存優先度=SFのノードの重み(weight)+userApplicationの ShutdownPriority
ノードの重み。デフォルト値=1。シャットダウン機構の設定の際に指定します。
設定はuserApplication作成時の属性設定で行ってください。設定値の変更方法については、“8.1.2 クラスタアプリケーションの運用属性の変更”を参照してください。
参照
userApplicationのShutdownPriority属性については、“6.7.5 属性の説明”を参照してください。
◆生存優先度の設計指針
以下に、代表的なケースをもとに、生存優先度の設計指針を示します。
[最も多くのノードを生存させたい場合]
全てのノードのweightを1(デフォルト)に設定
全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定
[特定のノードを生存させたい場合]
生存させるノードのweightをその他ノードのweightの合計の2倍以上の値に設定
全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定
以下は、node1を生存させる場合の例です。
[特定のアプリケーションが動作しているノードを生存させたい場合]
全てのノードのweightを1(デフォルト)に設定
動作を続けさせるユーザアプリケーションのShutdownPriority属性をその他のユーザアプリケーションのShutdownPriority属性と全てのノードのweightの合計の2倍以上の値に設定
以下は、app1が動作しているノードを生存させる場合の例です。
■設定の保存
設定内容を確認して、保存します。
ウィンドウの左パネルにはクラスタを構成するノードが表示され、各ノードに対して構成されたシャットダウンエージェントが表示されます。
図5.8 設定の保存
<次へ>をクリックすると、確認ポップアップ画面が表示されます。
<はい>を選択して設定を保存します。
■シャットダウン機構の構成状態の表示
設定を保存すると、シャットダウン機構の構成状態の表示画面が表示されます。この画面では、状態を表示するノードを選択することにより、各ノードのシャットダウン機構の構成状態を確認することができます。
参考
シャットダウン機構の構成状態は、Cluster AdminのCFメインウィンドウで、[ツール]メニューの [シャットダウン機構]-[状態の表示]を選択しても表示することができます。
図5.9 状態の表示
通常のシステム運用時にはUnknown と表示されており、ノードに異常が発生し、シャットダウン機構がノードの停止に成功すると、KillWorked に変わります。
ノード異常発生時にノードを停止させる経路をテストした状態を表しています。経路のテストが完了していない時はUnknown と表示されますが、構成されたシャットダウンエージェントが正常に動作した場合、TestWorked に変わります。
シャットダウンエージェントを初期化した状態を表しています。
構成ウィザードを終了する時は、<完了>をクリックするとポップアップ画面が表示されますので、<はい>をクリックします。
注意
この画面でシャットダウン機構が正常に動作していることを確認してください。
シャットダウン機構の設定が完了しているのに、初期状態がInitFailed と表示されたり、テスト状態にUnknown や赤字でTestFailed と表示された場合は、エージェントやハードウェアの構成設定に誤りがある可能性があります。/var/adm/messagesファイルとコンソール出力画面にエラーメッセージが出力されていないか確認してください。その後、出力されたメッセージの内容に対応した対処を実施します。
XSCFへの接続方法がtelnet接続の場合、この時点でテスト状態はTestFailed となります。“5.1.2.2.3 XSCFへの接続方法の設定”を実施後、シャットダウン機構が正常に動作していることを確認してください。
参照
エラーメッセージの対処方法については、以下のマニュアルを参照してください。
“PRIMECLUSTER Cluster Foundation 導入運用手引書”の“11.12 非同期監視メッセージ”
SPARC Enterprise M3000、M4000、M5000、M8000、M9000では、XSCFへの接続方法のデフォルトはSSH接続です。telnet接続に変更する場合は以下の手順で行います。
■接続方法の変更
全ノードで以下のコマンドを実行し、接続方法を変更します。
# /etc/opt/FJSVcluster/bin/clrccusetup -m -t telnet
接続方法の変更後は、clrccusetup -lコマンドを実行し、connection-typeがtelnetと表示されていることを確認してください。
# /etc/opt/FJSVcluster/bin/clrccusetup -l Device-name cluster-host-name IP-address host-name user-name connection-type ------------------------------------------------------------------------------- xscf fuji2 xscf2 1 xuser telnet xscf fuji3 xscf3 1 xuser telnet
■シャットダウン機構の起動
各ノードで以下のコマンドを実行し、シャットダウン機構が起動済か確認してください。
# /opt/SMAW/bin/sdtool -s
シャットダウン機構の構成状態が表示された場合、シャットダウン機構は起動済です。
“The RCSD is not running”が表示された場合、シャットダウン機構は起動されていません。
シャットダウン機構が起動済の場合、以下のコマンドを実行し、シャットダウン機構を再起動してください。
# /opt/SMAW/bin/sdtool -r
シャットダウン機構が起動していない場合、以下のコマンドを実行し、シャットダウン機構を起動してください。
# /opt/SMAW/bin/sdtool -b
SPARC Enterprise T5120、T5220、T5140、T5240、T5440、SPARC T3、T4シリーズでは、ILOM を使用します。
シャットダウン機構の設定をする前に、ILOM に関する以下の設定を確認してください。
シャットダウン機構用にログインユーザアカウントが作成され、そのアカウントの CLI モードが、デフォルトモード(*1)に設定されていること
シャットダウン機構用のログインユーザアカウントを使用して、全てのクラスタノードから ILOM へ SSH 接続し、SSH初回接続時のユーザ問い合わせ (RSA鍵の生成など) が完了していること
ILOM 3.0 の場合、以下の設定も確認してください。
シャットダウン機構用のログインユーザアカウントに、以下の権限のいずれかが設定されていること
keyswitch_state パラメータが normal の場合
Console, Reset and Host Control, Read Only (cro)
Operator(*2)
keyswitch_state パラメータが locked の場合
Admin, Console, Reset and Host Control, Read Only (acro)
Administrator(*2)
必要な権限が設定されていない場合、権限の設定状況により、シャットダウンエージェントのテスト失敗(TestFailed)、または強制停止に失敗(KillFailed)します。
シャットダウン機構用のログインユーザアカウントに、SSH ホストベースキー認証を使用していないこと
また、ILOMに関する以下の情報をメモしてください。
ILOM のIPアドレス(*3)
ILOM においての、シャットダウン機構用のログインユーザアカウントとパスワード
*1) ログインユーザアカウントの CLI モードが、デフォルトモードに設定されているかどうかは、以下の方法で確認できます。
ILOM の CLI にログインします。
プロンプトの状態を確認します。
デフォルトモードに設定されている場合のプロンプト:
->
alom モードに設定されている場合のプロンプト:
sc>
*2) ILOM 3.0 の ILOM 2.x 互換により、ILOM 2.x の Administrator 権限またはOperator 権限を持つユーザでも動作可能です。
*3) ネットワークルーティングが設定されている場合は、ILOM の IP アドレスがクラスタノードの管理 LAN と同一セグメントである必要はありません。
参照
ILOMの設定方法、確認方法については、以下を参照してください。
ILOM 2.x の場合
Integrated Lights Out Manager ユーザーズガイド
ILOM 3.0 の場合
Integrated Lights Out Manager (ILOM) 3.0 概念ガイド
Integrated Lights Out Manager (ILOM) 3.0 Web Interface 手順ガイド
Integrated Lights Out Manager (ILOM) 3.0 CLI 手順ガイド
Integrated Lights Out Manager (ILOM) 3.0 入門ガイド
ハードウェアの機種により、必要なシャットダウンエージェントが異なります。
以下に示す、ハードウェアの機種とシャットダウンエージェントの組み合わせを確認してください。
SPARC Enterprise T5120、T5220、T5140、T5240、T5440、SPARC T3、T4シリーズの場合
ILOM Panic
ILOM Reset
■シャットダウン構成ウィザードの起動
Cluster Admin 画面のCFメインウィンドウで、[ツール]メニューの [シャットダウン機構]-[設定ウィザード] を選択して、シャットダウン構成ウィザードを起動します。
注意
シャットダウン機構の設定は、CFウィザードでCF構成の設定を完了したあと、続けて行うこともできます。
以下の確認ポップアップ画面が表示されるので、<はい>をクリックすると、シャットダウン構成ウィザードが起動します。
■設定方法の選択
シャットダウン機構の設定方法は、以下の2種類を選択することができます。
簡単な設定(推奨)
詳細な設定
ここでは、「簡単な設定(推奨)」を使用した設定について説明します。この方法では、推奨されているPRIMECLUSTERのシャットダウン機構の構成を流れに沿って設定できます。
図5.10 設定方法の選択
「簡単な設定(推奨)」 を選択して、<次へ>をクリックします。
■シャットダウンエージェントの選択
シャットダウンエージェントの選択画面が表示されます。
図5.11 シャットダウンエージェントの選択
ハードウェアの機種を確認して、適切なシャットダウンエージェントを選択します。
SPARC Enterprise T5120、T5220、T5140、T5240、T5440、SPARC T3、T4シリーズの場合
[ILOM]を選択します。
以下のシャットダウンエージェントが自動で設定されます。
ILOM Panic
ILOM Reset
[ILOM]を選択後、<次へ>をクリックします。
参考
シャットダウンエージェントを選択すると、タイムアウト値が自動で設定されます。
ILOM Panic/ILOM Resetの場合
タイムアウト値 = 70 (秒)
■ILOMの設定
ILOMの情報を入力する画面が表示されます。
図5.12 ILOMの設定
“5.1.2.3.1 コンソール情報の確認”でメモしておいたILOMに関する情報を設定します。
ILOMのIPアドレスまたは/etc/inet/hostsに登録されているILOMのホスト名を入力します。
指定可能なアドレス形式は、IPv4アドレスおよびIPv6アドレスです。
IPv6のリンクローカルアドレスは使用できません。
ILOMへログインするためのユーザ名を入力します。
ILOMへログインするためのパスワードを入力します。
設定終了後、<次へ>をクリックします。
■ノードの重みと管理LAN IPアドレスの設定
ノードの重みと管理LAN IPアドレスを設定する画面が表示されます。
図5.13 ノードの重みと管理LAN IPアドレスの設定
ノードの重みと管理LAN IPアドレスを設定します。
クラスタを構成するノードの重みを入力します。重みは、クラスタパーティションが発生した場合に生存するノード群の生存優先度の特定に使用されます。各ノードに対して入力できる値は1 ~ 300 です。
生存優先度と重みについては下の説明を参照してください。
直接IP アドレスを入力するか、またはタブをクリックして管理LAN のIP アドレスに割り当てられたホスト名をセットします。
指定可能なアドレス形式は、IPv4アドレスおよびIPv6アドレスです。
IPv6のリンクローカルアドレスは使用できません。
設定終了後、<次へ>をクリックします。
◆生存優先度
クラスタインタコネクトの障害によりクラスタパーティションが発生した場合、まだ全ノードがユーザ資産にアクセスできる状態にあります。クラスタパーティションについては、“PRIMECLUSTER コンセプトガイド”の“2.2.2.1 データ整合性の保証”を参照してください。
ユーザ資産であるデータの整合性を保証するために、生存させるノード群と強制停止させるノード群を決定する必要があります。
PRIMECLUSTERでは、それぞれのノード群に対する重み付けを「生存優先度」と呼んでいます。
ノードの重みが大きいほど生存優先度は高くなり、小さくなるにつれて生存優先度は低くなります。ノード群の生存優先度が同じ場合は、ノード名がアルファベット順で最も早いノードを含むノード群が生存します。
生存優先度は、以下の計算で求められます。
生存優先度=SFのノードの重み(weight)+userApplicationの ShutdownPriority
ノードの重み。デフォルト値=1。シャットダウン機構の設定の際に指定します。
設定はuserApplication作成時の属性設定で行ってください。設定値の変更方法については、“8.1.2 クラスタアプリケーションの運用属性の変更”を参照してください。
参照
userApplicationのShutdownPriority属性については、“6.7.5 属性の説明”を参照してください。
◆生存優先度の設計指針
以下に、代表的なケースをもとに、生存優先度の設計指針を示します。
[最も多くのノードを生存させたい場合]
全てのノードのweightを1(デフォルト)に設定
全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定
[特定のノードを生存させたい場合]
生存させるノードのweightをその他ノードのweightの合計の2倍以上の値に設定
全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定
以下は、node1を生存させる場合の例です。
[特定のアプリケーションが動作しているノードを生存させたい場合]
全てのノードのweightを1(デフォルト)に設定
動作を続けさせるユーザアプリケーションのShutdownPriority属性をその他のユーザアプリケーションのShutdownPriority属性と全てのノードのweightの合計の2倍以上の値に設定
以下は、app1が動作しているノードを生存させる場合の例です。
■設定の保存
設定内容を確認して、保存します。
ウィンドウの左パネルにはクラスタを構成するノードが表示され、各ノードに対して構成されたシャットダウンエージェントが表示されます。
図5.14 設定の保存
<次へ>をクリックすると、確認ポップアップ画面が表示されます。
<はい>を選択して設定を保存します。
■シャットダウン機構の構成状態の表示
設定を保存すると、シャットダウン機構の構成状態の表示画面が表示されます。この画面では、状態を表示するノードを選択することにより、各ノードのシャットダウン機構の構成状態を確認することができます。
参考
シャットダウン機構の構成状態は、Cluster AdminのCFメインウィンドウで、[ツール]メニューの [シャットダウン機構]-[状態の表示]を選択しても表示することができます。
図5.15 状態の表示
通常のシステム運用時にはUnknown と表示されており、ノードに異常が発生し、シャットダウン機構がノードの停止に成功すると、KillWorked に変わります。
ノード異常発生時にノードを停止させる経路をテストした状態を表しています。経路のテストが完了していない時はUnknown と表示されますが、構成されたシャットダウンエージェントが正常に動作した場合、TestWorked に変わります。
シャットダウンエージェントを初期化した状態を表しています。
構成ウィザードを終了する時は、<完了>をクリックするとポップアップ画面が表示されますので、<はい>をクリックします。
注意
この画面でシャットダウン機構が正常に動作していることを確認してください。
シャットダウン機構の設定が完了しているのに、初期状態がInitFailed と表示されたり、テスト状態にUnknown や赤字でTestFailed と表示された場合は、エージェントやハードウェアの構成設定に誤りがある可能性があります。/var/adm/messagesファイルとコンソール出力画面にエラーメッセージが出力されていないか確認してください。その後、出力されたメッセージの内容に対応した対処を実施します。
SPARC Enterprise T1000、T2000 では、ALOM を使用します。
シャットダウン機構の設定をする前に、ALOM に関する以下の設定を確認してください。
シャットダウン機構用にログインユーザアカウントが作成され、cレベル (コンソールアクセス) 権限が付与されていること
外部からの接続許可プロトコル種別で、telnetが有効になっていること
以下のALOM構成変数はデフォルトから変更されていないこと
if_emailalerts false(デフォルト)
sc_clieventlevel 2(デフォルト)
sc_cliprompt sc(デフォルト)
注意
ALOM への外部からの接続許可はデフォルトでSSHとなっています。その場合、シャットダウン機構ではサポートされません。
ALOM への接続がシリアルポート接続のみの場合、シャットダウン機構ではサポートされません。
また、ALOMに関する以下の情報をメモしてください。
ALOMのIPアドレス(*1)または/etc/inet/hostsに登録されているALOMホスト名
ALOMへログインするためのユーザ名
ALOMへログインするためのパスワード
*1) ネットワークルーティングが設定されている場合は、ALOM の IP アドレスがクラスタノードの管理 LAN と同一セグメントである必要はありません。
参照
ALOMの設定方法、確認方法については、“Advanced Lights out Management (ALOM) CMT ガイド”を参照してください。
ハードウェアの機種により、必要なシャットダウンエージェントが異なります。
以下に示す、ハードウェアの機種とシャットダウンエージェントの組み合わせを確認してください。
SPARC Enterprise T1000、T2000の場合
ALOM Break
■シャットダウン構成ウィザードの起動
Cluster Admin 画面のCFメインウィンドウで、[ツール]メニューの [シャットダウン機構]-[設定ウィザード] を選択して、シャットダウン構成ウィザードを起動します。
注意
シャットダウン機構の設定は、CFウィザードでCF構成の設定を完了したあと、続けて行うこともできます。
以下の確認ポップアップ画面が表示されるので、<はい>をクリックすると、シャットダウン構成ウィザードが起動します。
■設定方法の選択
シャットダウン機構の設定方法は、以下の2種類を選択することができます。
簡単な設定(推奨)
詳細な設定
ここでは、「簡単な設定(推奨)」を使用した設定について説明します。この方法では、推奨されているPRIMECLUSTERのシャットダウン機構の構成を流れに沿って設定できます。
図5.16 設定方法の選択
「簡単な設定(推奨)」 を選択して、<次へ>をクリックします。
■シャットダウンエージェントの選択
シャットダウンエージェントの選択画面が表示されます。
図5.17 シャットダウンエージェントの選択
ハードウェアの機種を確認して、適切なシャットダウンエージェントを選択します。
SPARC Enterprise T1000、T2000の場合
[ALOM]を選択します。
以下のシャットダウンエージェントが自動で設定されます。
ALOM Break
[ALOM]を選択後、<次へ>をクリックします。
参考
シャットダウンエージェントを選択すると、タイムアウト値が自動で設定されます。
ALOM Breakの場合
タイムアウト値 = 40 (秒)
■ALOMの設定
ALOMの情報を入力する画面が表示されます。
図5.18 ALOMの設定
“5.1.2.4.1 コンソール情報の確認”でメモしておいたALOMに関する情報を設定します。
ALOMのIPアドレスを入力します。
指定可能なアドレス形式は、IPv4アドレスです。
ALOMへログインするためのユーザ名を入力します。
ALOMへログインするためのパスワードを入力します。
設定終了後、<次へ>をクリックします。
■ノードの重みと管理LAN IPアドレスの設定
ノードの重みと管理LAN IPアドレスを設定する画面が表示されます。
図5.19 ノードの重みと管理LAN IPアドレスの設定
ノードの重みと管理LAN IPアドレスを設定します。
クラスタを構成するノードの重みを入力します。重みは、クラスタパーティションが発生した場合に生存するノード群の生存優先度の特定に使用されます。各ノードに対して入力できる値は1 ~ 300 です。
生存優先度と重みについては下の説明を参照してください。
直接IP アドレスを入力するか、またはタブをクリックして管理LAN のIP アドレスに割り当てられたホスト名をセットします。
指定可能なアドレス形式は、IPv4アドレスです。
設定終了後、<次へ>をクリックします。
◆生存優先度
クラスタインタコネクトの障害によりクラスタパーティションが発生した場合、まだ全ノードがユーザ資産にアクセスできる状態にあります。クラスタパーティションについては、“PRIMECLUSTER コンセプトガイド”の“2.2.2.1 データ整合性の保証”を参照してください。
ユーザ資産であるデータの整合性を保証するために、生存させるノード群と強制停止させるノード群を決定する必要があります。
PRIMECLUSTERでは、それぞれのノード群に対する重み付けを「生存優先度」と呼んでいます。
ノードの重みが大きいほど生存優先度は高くなり、小さくなるにつれて生存優先度は低くなります。ノード群の生存優先度が同じ場合は、ノード名がアルファベット順で最も早いノードを含むノード群が生存します。
生存優先度は、以下の計算で求められます。
生存優先度=SFのノードの重み(weight)+userApplicationの ShutdownPriority
ノードの重み。デフォルト値=1。シャットダウン機構の設定の際に指定します。
設定はuserApplication作成時の属性設定で行ってください。設定値の変更方法については、“8.1.2 クラスタアプリケーションの運用属性の変更”を参照してください。
参照
userApplicationのShutdownPriority属性については、“6.7.5 属性の説明”を参照してください。
◆生存優先度の設計指針
以下に、代表的なケースをもとに、生存優先度の設計指針を示します。
[最も多くのノードを生存させたい場合]
全てのノードのweightを1(デフォルト)に設定
全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定
[特定のノードを生存させたい場合]
生存させるノードのweightをその他ノードのweightの合計の2倍以上の値に設定
全てのユーザアプリケーションのShutdownPriority属性を0(デフォルト)に設定
以下は、node1を生存させる場合の例です。
[特定のアプリケーションが動作しているノードを生存させたい場合]
全てのノードのweightを1(デフォルト)に設定
動作を続けさせるユーザアプリケーションのShutdownPriority属性をその他のユーザアプリケーションのShutdownPriority属性と全てのノードのweightの合計の2倍以上の値に設定
以下は、app1が動作しているノードを生存させる場合の例です。
■設定の保存
設定内容を確認して、保存します。
ウィンドウの左パネルにはクラスタを構成するノードが表示され、各ノードに対して構成されたシャットダウンエージェントが表示されます。
図5.20 設定の保存
<次へ>をクリックすると、確認ポップアップ画面が表示されます。
<はい>を選択して設定を保存します。
■シャットダウン機構の構成状態の表示
設定を保存すると、シャットダウン機構の構成状態の表示画面が表示されます。この画面では、状態を表示するノードを選択することにより、各ノードのシャットダウン機構の構成状態を確認することができます。
参考
シャットダウン機構の構成状態は、Cluster AdminのCFメインウィンドウで、[ツール]メニューの [シャットダウン機構]-[状態の表示]を選択しても表示することができます。
図5.21 状態の表示
通常のシステム運用時にはUnknown と表示されており、ノードに異常が発生し、シャットダウン機構がノードの停止に成功すると、KillWorked に変わります。
ノード異常発生時にノードを停止させる経路をテストした状態を表しています。経路のテストが完了していない時はUnknown と表示されますが、構成されたシャットダウンエージェントが正常に動作した場合、TestWorked に変わります。
シャットダウンエージェントを初期化した状態を表しています。
構成ウィザードを終了する時は、<完了>をクリックするとポップアップ画面が表示されますので、<はい>をクリックします。
注意
この画面でシャットダウン機構が正常に動作していることを確認してください。
シャットダウン機構の設定が完了しているのに、初期状態がInitFailed と表示されたり、テスト状態にUnknown や赤字でTestFailed と表示された場合は、エージェントやハードウェアの構成設定に誤りがある可能性があります。/var/adm/messagesファイルとコンソール出力画面にエラーメッセージが出力されていないか確認してください。その後、出力されたメッセージの内容に対応した対処を実施します。