本機能は以下の異常を検知して仮想サーバを切り替えます。
業務異常
仮想サーバで動作する業務の異常は、PRIMECLUSTER(RMS)が検出します
仮想サーバ異常
仮想サーバが稼働するクラウドインフラの異常は、パブリッククラウドが提供する機能(例:CloudWatch)で検出します
なお、上記の異常発生時には、異常が発生したアベイラビリティゾーンとは別の正常なアベイラビリティゾーンで仮想サーバを起動します。これにより、パブリッククラウドのインフラの障害(例:サーバラック単位や、VMホスト単位の電源ダウンなど)に対して、耐故障性の高いシステムを構築できます。
注意
パブリッククラウドの障害などで、PRIMECLUSTERが使用するクラウドAPIが利用不可能になった場合、切替え時に切替え元の仮想サーバのメタデータ(*1)が切替え先の仮想サーバに引き継がれない場合があります。本事象が発生した場合、切替え先の仮想サーバでの業務再開のために、すぐに仮想サーバのメタデータを再設定してください。なお、本事象のメッセージおよび対処の詳細は、”PRIMECLUSTER活用ガイド <メッセージ集>”の”第8章 スマートワークロードリカバリのメッセージ”を参照してください。
*1 : AWSの場合、セキュリティグループやタグなどのインスタンスメタデータが該当します
業務に異常が発生した場合の振る舞いは、以下の通りです。
業務に異常が発生
RMSが業務の異常を検知
RMSが仮想サーバを停止することで、パブリッククラウドのリソース監視機構に通知
パブリッククラウドのリソース監視機構は異常を受け付けると、サーバレス基盤上の切替え機構に対して切替えを要求
切替え機構は切替え元の仮想サーバを破棄し、切替え元とは異なる任意のアベイラビリティゾーンで仮想サーバを起動
仮想サーバに異常が発生した場合の振る舞いは、以下の通りです。
仮想サーバに異常が発生
パブリッククラウドのリソース監視機構が異常を検知
パブリッククラウドのリソース監視機構がサーバレス基盤上の切替え機構に対して切り替えを要求
切替え機構は切替え元の仮想サーバを破棄し、切替え元とは異なる任意のアベイラビリティゾーンで仮想サーバを起動
図1.29 異常時の振る舞い