PRIMECLUSTER 導入運用手引書 4.1 (Solaris(TM) オペレーティングシステム版) |
目次 索引 |
第1部 導入準備編 | > 第1章 構築の流れ |
PRIMECLUSTERを用いてクラスタシステムを構築するにあたって、さまざまな事象が発生した場合にもシステム全体が正常に動作し、クラスタアプリケーションとして構築した業務が継続することを、運用前に確認しておく必要があります。
PRIMECLUSTERシステム(1:1運用待機の場合)は、以下の図のような運用状態をとります。
PRIMECLUSTERシステムは下図の状態遷移に従い、各々の運用状態へと遷移します。システムが正常に動作することを確認するには、全ての運用状態と、運用状態へ遷移する各状態遷移についてテストする必要があります。
意味 |
|
二重化運用状態 (Dual instance operation) |
ユーザ業務が運用中であり、かつフェイルオーバできる状態。 この状態では、クラスタアプリケーションは「運用」状態と「待機」状態の2種類の状態から構成されています。 「運用」状態で異常が発生した場合においても、常に「待機」状態を新しく「運用」状態として切替えるためユーザ業務の継続運用が可能です。 |
片側運用状態 (Single instance operation) |
ユーザ業務が運用中であるが、フェイルオーバできない状態。 この状態では、クラスタアプリケーションは「運用」状態と「停止」状態の2種類の状態から構成されます。 ユーザ業務は動作しているが、「待機」状態が存在しないため、「運用」状態で異常が発生した場合、フェイルオーバが行えず、ユーザ業務の継続運用が不可能となります。 |
停止状態 (Stopped state) |
ユーザ業務が停止している状態。 |
上記「運用」「待機」「停止」の状態については、以下のように「RMSの稼動状態」と「クラスタアプリケーションの状態」で判断できます。
RMSの稼動状態 |
クラスタアプリケーションの状態 |
備考 |
|
運用(OPERATING) |
稼動 |
Online |
|
待機(STANDBY) |
稼動 |
Offline または Standby |
|
停止(STOP) |
停止 |
―― ※"Unknown" |
※SysnodeがOffline状態 |
※GUI(Cluster Admin)の運用から停止(STOP)状態を参照する場合の見え方。
業務の起動に関するテストを以下の観点で行ってください。
異常が発生したクラスタアプリケーションはFaultedという状態となります。
このクラスタアプリケーションを再び業務に組み込む場合は、「Faultのクリア」という操作を行いFault状態を解除する必要があります。
「Faultのクリア」に関するテストを以下の観点で行ってください。
「フェイルオーバ」および「スイッチオーバ」に関するテストを以下の観点で行ってください。
運用ノードから、ディスクをアクセスできることを確認する。
切替ディスクであれば、ファイルシステムがマウントされているか、df(1M)コマンドで確認することも可能。
また、フェイルオーバテストの際には、切替え時間の測定も行ってください。クラスタシステムに障害が発生した場合の業務への影響度(業務の停止時間)を把握するために、障害検出要因ごとの切替え時間を測定し、障害発生時の業務復旧時間を確認してください。
「交換」に関するテストを以下の観点で行ってください。
運用ノードから、ディスクをアクセスできること、待機ノードからディスクにアクセスできないことを確認する。
切替ディスクであれば、ファイルシステムがマウントまたはアンマウントされているか、df(1M)コマンドで確認することも可能。
CmdlineリソースのStartスクリプト、Stopスクリプトに記載したコマンドが正しく実行されていることを、以下のような方法で確認する。
IPアドレス引継ぎが正常に行われていることを確認する。
アプリケーションの運用が旧運用ノードから引継ぎが行われていることを確認する。
「停止」に関するテストを以下の観点で行ってください。
障害発生時に業務が継続して動作することを確認してください。
目次 索引 |