PRIMECLUSTER 活用ガイド <クラスタ構築・運用時の留意点> (Solaris(TM)オペレーティングシステム/Linux版) |
目次
索引
![]() ![]() |
付録B RMS 環境変数一覧 |
グローバル環境変数は、クラスタ全体で定義する環境変数です。クラスタ内のすべてのノードで同じ設定にする必要があります。
hvenv.local コマンドファイルで環境変数を再定義することができます。
グローバル環境変数(ENV)の設定は、クラスタシステムで共通な構成定義のチェックサムでも検証されます。チェックサムは BM(ベースモニタ)の起動時に各ノードで検証され、いずれかのノードでチェックサムが異なっていると、RMS の起動は失敗します。
RMS の起動時に無視されるクラスタノードのリスト。デフォルトでは、この環境変数は設定されません。AutoStartUp 属性を設定してあり、userApplication で定義されているすべてのクラスタノードが Online を報告すると、userApplication が自動起動処理を開始します。
クラスタノードがこのリストに含まれている場合は、このノードが Online 状態を報告していなくても、自動起動処理が開始されます。
1つ以上のクラスタノードを一定期間クラスタから削除する必要があり、削除されたクラスタノードを指定する構成定義ファイルを RMS が使用し続ける場合に、この環境変数を使用します。この場合、この環境変数で使用不能なクラスタノードを指定すると、使用不能なクラスタノードが Online を報告しなくても、すべての userApplication が自動的にオンラインになります。
この環境変数を使用する場合は、すべてのクラスタノード上で正しく定義し、常に最新の値に設定する必要があります。ノードをクラスタに戻すときは、この環境変数からそのノードを削除します。ノードを環境変数から削除しないと、RMS は起動処理中にこのノードを無視し、このリストで指定されているノードでアプリケーションが稼動しているかどうかをチェックしないので、データが失われる場合があります。この環境変数を使用する場合は、システム管理者がこのリストを最新の状態に保つ必要があります。
設定値: 0 - MAXINT
デフォルト :60(秒)
RMS の起動時にクラスタノードが Online を報告するまでの待ち時間を(秒数で)指定します。この時間が過ぎて、すべてのクラスタノードがオンラインにならないと、Online を報告しないクラスタノード、および userApplication を自動的に起動できない理由が、switchlog メッセージによって報告されます。
この属性は警告メッセージです。AutoStartUp は、指定された時間の経過後も処理を継続します。
設定値: 0 - MAXINT
デフォルト : 120(秒)
各 Online ノードのチェックサムとローカルチェックサムが同じであると確認されるまで RMS BM(ベースモニタ)が待つ時間(秒数)。
この時間内にチェックサムが確認されると、ローカルノード上の RMS が通常どおり動作し続けます。一方、リモートノードのチェックサムが確認されない場合、または異なるチェックサムが確認された場合、HV_CHECKSUM_INTERVAL の今回の待機時間中に起動されたローカルモニタはシャットダウンします。
また、リモートノードのチェックサムが確認されない場合、または異なるチェックサムが確認された場合、HV_CHECKSUM_INTERVAL の今回の待機時間より前に起動されていたローカルモニタはこのリモートノードを Offline と認識します。
設定値: 0 - MAXINT
デフォルト : 30
最終 Online ノード(LOH)を特定するためにタイムスタンプを比較する際の、最小時間差を指定(秒数)。最終 Online ノード(LOH)とは、userApplication が最後に Online 状態であったノードを意味します。本設定は OnlinePriority 属性が設定されている場合に使用されます。クラスタノードが異なる 2つの userApplication を比較して、LOH タイムスタンプエントリの差がこの属性で指定する時間よりも小さかった場合、RMS は自動起動せず、優先順位の変更は行われません。この場合はコンソールにメッセージを送信し、オペレータ介入が必要になります。この値を設定する場合は、そのクラスタ内部での時刻同期精度を考慮に入れる必要があります。クラスタノード間で発生しうる時間差よりも大きい値を指定してください。
設定値: 0 - MAXINT
デフォルト : 120(秒)
RMS が hvcm -c で起動された場合に、Online ノードから構成ファイルを受信するまで RMS が待つ時間(秒数)。構成定義ファイルが HV_WAIT_CONFIG 秒以内に受信されなかった場合は、ローカルモニタは RELIANT_BUILD_PATH で指定された構成定義ファイルを使って実行を開始します。このファイルが存在しない場合、ローカルモニタは最小構成で実行を継続します。
設定値: 任意の有効なパス
デフォルト : /opt/SMAWRrms
RMS ディレクトリ階層のルートディレクトリを指定します。通常は、利用者がデフォルト設定を変更する必要はありません。
設定値: 0-MAXINT
4.1A20以前
デフォルト : 150(秒)
hvshut コマンドがタイムアウトになって、エラーメッセージが生成されるまでの時間を(秒数で)指定します。この値は、構成設定されたすべてのアプリケーションが、すべてのクラスタノード上でオフラインになるのに必要な最大時間より大きな値であることが必要です。
この値が小さすぎると、hvshut コマンドがタイムアウトになって、エラーメッセージが生成されます。ただし、シャットダウンプロセスが停止するということではなく、hvshut コマンドがタイムアウトになるだけです。シャットダウンプロセスはRMS システム内で続行されます。
4.1A30以降
デフォルト : 900(秒)
hvshut コマンドがタイムアウトになって、エラーメッセージが生成されるまでの時間を(秒数で)指定します。この値は、構成設定されたすべてのアプリケーションが、すべてのクラスタノード上でオフラインになるのに必要な最大時間より大きな値であることが必要です。
この値が小さすぎると、RMS が正常に終了できません。実行中のスクリプトはすべて直ちに終了し、RMS の管理下にあるリソースのいくつかは、制御が失われた状態になります。RMS を再起動するには、まずこれらのリソースを手動で停止する必要があります。
設定値は、デフォルトのままで問題ない場合もありますが、必ず構成設定に応じて個別に検討してください。オフライン処理に時間がかかる場合は、ノードの数が多い、リソースが多い、ネットワークが遅い、ハードウェアに問題がある、などの原因が考えられます。このような場合は、使用中のクラスタアプリケーションやリソースに詳しい専門家に相談することをお奨めします。
専門家の助言が得られない場合は、次のように RELIANT_SHUT_MIN_WAIT 値を設定してください。一時的に大きな値(例 4000)を設定し、運用環境を想定した条件のもとで何回か実行してみます。その結果から最悪のオフライン処理時間を検討し、これに安全をみて(例 10% 増し等)値を決定してください。
オフライン処理のタイムアウトの原因診断は、その影響が大きいため、他の方法で RMS を自動停止させる前に行ってください。
目次
索引
![]() ![]() |