Oracle Solarisで、以下の環境の場合のクラスタシステムの可用性について説明します。
物理環境のクラスタシステム
Oracle VM Server for SPARC環境のクラスタシステム
Oracle Solaris カーネルゾーン環境のクラスタシステム
Oracle Solaris ゾーン環境のクラスタシステム
Oracle Solarisで、以下の物理環境、Oracle VM Server for SPARC環境の場合のクラスタシステムの可用性について説明します。
物理環境のクラスタシステム
Oracle VM Server for SPARC環境の異なる物理パーティション間のゲストドメインクラスタ
Oracle VM Server for SPARC環境の同一物理パーティション内のゲストドメインクラスタ
Oracle VM Server for SPARC環境の制御ドメイン間クラスタ
監視対象 | 物理環境 | Oracle VM Server for SPARC環境 | ||
---|---|---|---|---|
異なる物理パーティション間のゲストドメインクラスタ | 同一物理パーティション内のゲストドメインクラスタ | 制御ドメイン間クラスタ | ||
(1) 物理パーティション | ○ | ○ | × | ○ |
(2) 共用ディスクおよびディスクアクセスパス | ○ | ○ | × | ○ |
(3) 業務LAN | ○ | ○ | × | ○ |
(4) OS(物理、制御ドメイン) | ○ | ○ | ○*1 | ○ |
(5) OS(ゲストドメイン) | - | ○ | ○ | ○*2 |
(6) 業務(クラスタアプリケーション) | ○ | ○ | ○ | ○*3 |
異常時の業務継続 ○:可、×:不可
*1 制御ドメインのOS異常時もゲストドメインのOSは継続動作可のため業務継続可
*2 ゲストドメインのOSの監視不可。ゲストドメインの状態(ldm list-domainで表示される状態)の異常時、制御ドメインのPRIMECLUSTERで監視して待機系に切り替えて業務継続可
*3 制御ドメイン上の業務(クラスタアプリケーション)監視可、ゲストドメイン上の業務監視不可
図1.13 物理環境
図1.14 Oracle VM Server for SPARC環境
監視対象の異常検出方法
物理パーティション
サーバのシステム監視機構と連携した非同期監視が、CPUやメモリ等の異常を契機とするパニック、およびリセットを即時検出し、待機系に切り替えます。
共用ディスクおよびディスクアクセスパス
ボリューム管理機能(GDS)と組み合わせることで、ディスクアクセスおよび、ディスクアクセスパスの故障を検出(Gdsリソースで監視)し、ディスクアクセス不可または、ディスクアクセスパスの全系故障の場合に待機系に切り替えます。
業務LAN
ネットワーク多重化機能(GLS)と組み合わせることで、業務LANのネットワークアダプタや経路の故障を検出(Glsリソースで監視)し、ネットワークの全系故障の場合に待機系に切り替えます。
OS(物理、制御ドメイン)
非同期監視により、OSのパニック、およびリセットを即時検出し、待機系に切り替えます。クラスタインタコネクト(LAN)定周期監視によりOSのハングアップを検出し、待機系に切り替えます。
同一物理パーティション内のゲストドメインクラスタの場合、制御ドメインのOS異常は検出できません。(制御ドメインがシングルのため)
OS(ゲストドメイン)
非同期監視により、OSのパニック、およびリセットを即時検出し、待機系に切り替えます。クラスタインタコネクト(LAN)定周期監視によりOSのハングアップを検出し、待機系に切り替えます。
制御ドメイン間クラスタの場合、ゲストドメインの業務の異常は検出できません。
業務(クラスタアプリケーション)
クラスタアプリケーションのリソース異常発生時に待機系に切り替えます。
Oracle Solarisのカーネルゾーンで、以下の場合のクラスタシステムの可用性について説明します。
異なる物理パーティション間のカーネルゾーン間クラスタ(制御ドメイン)
異なる物理パーティション間のカーネルゾーン間クラスタ(ゲストドメイン)
同一物理パーティション内のカーネルゾーン間クラスタ(制御ドメイン)
同一物理パーティション内のカーネルゾーン間クラスタ(ゲストドメイン)
監視対象 | Oracle Solaris カーネルゾーン環境 | |||
---|---|---|---|---|
異なる物理パーティション間のカーネルゾーン間クラスタ | 異なる物理パーティション間のカーネルゾーン間クラスタ | 同一物理パーティション内のカーネルゾーン間クラスタ | 同一物理パーティション内のカーネルゾーン間クラスタ | |
(1) 物理パーティション | ○ | ○ | × | × |
(2) 共用ディスクおよびディスクアクセスパス | ○ | ○ | × | × |
(3) 業務LAN | ○ | ○ | × | × |
(4) OS(物理、制御ドメイン) | ○ | ○*1 | × | ○*1 |
(5) OS(ゲストドメイン) | - | ○ | - | ○*2 |
(6) OS(カーネルゾーン) | ○ | ○ | ○ | ○ |
(7) 業務(クラスタアプリケーション) | ○ | ○ | ○ | ○ |
異常時の業務継続 ○:可、×:不可
*1 制御ドメインのOS異常時もゲストドメインのOSは継続動作可のため業務継続可
*2 同一ゲストドメイン内のカーネルゾーン間クラスタの場合は、業務継続不可
図1.15 Oracle Solaris カーネルゾーン環境(異なる物理パーティション間)
図1.16 Oracle Solaris カーネルゾーン環境(同一物理パーティション内)
監視対象の異常検出方法
物理パーティション
サーバのシステム監視機構と連携した非同期監視が、CPUやメモリ等の異常を契機とするパニック、およびリセットを即時検出し、待機系に切り替えます。
共用ディスクおよびディスクアクセスパス
ボリューム管理機能(GDS)と組み合わせることで、ディスクアクセスおよび、ディスクアクセスパスの故障を検出(Gdsリソースで監視)し、ディスクアクセス不可または、ディスクアクセスパスの全系故障の場合に待機系に切り替えます。
業務LAN
ネットワーク多重化機能(GLS)と組み合わせることで、業務LANのネットワークアダプタや経路の故障を検出(Glsリソースで監視)し、ネットワークの全系故障の場合に待機系に切り替えます。
OS(物理、制御ドメイン)
非同期監視により、OSのパニック、およびリセットを即時検出し、待機系に切り替えます。また、クラスタインタコネクト(LAN)定周期監視によりOSのハングアップを検出し、待機系に切り替えます。
同一物理パーティション内のカーネルゾーンクラスタの場合、制御ドメインのOS異常は検出できません。(制御ドメインがシングルのため)
OS(ゲストドメイン)
非同期監視により、OSのパニック、およびリセットを即時検出し、待機系に切り替えます。また、クラスタインタコネクト(LAN)定周期監視によりOSのハングアップを検出し、待機系に切り替えます。
同一ゲストドメイン内のカーネルゾーンクラスタの場合、ゲストドメインのOS異常は検出できません。(ゲストドメインがシングルのため)
OS(カーネルゾーン)
クラスタインタコネクト(LAN)定周期監視によりOSのパニック、リセット、およびハングアップを検出し、待機系に切り替えます。
業務(クラスタアプリケーション)
クラスタアプリケーションのリソース異常発生時に待機系に切り替えます。
Oracle Solaris ゾーンで、以下の環境の場合のクラスタシステムの可用性について説明します。
コールドスタンバイ環境(待機側のノングローバルゾーンが起動していない状態(待機側の業務も起動していない状態))
ウォームスタンバイ環境(待機側のノングローバルゾーンは起動している状態(待機側の業務は起動していない状態))
シングルクラスタ環境
監視対象 | コールドスタンバイ | ウォームスタンバイ | シングルクラスタ |
---|---|---|---|
(1) 物理パーティション | ○ | ○ | - |
(2) 共用ディスクおよびディスクアクセスパス | ○ | ○ | - |
(3) 業務LAN | ○ | ○ | - |
(4) OS(グローバルゾーン) | ○ | ○ | - |
(5) OS(ノングローバルゾーン) | ○ | ○ | ○*1 |
(6) 業務(クラスタアプリケーション) | ○ | ○ | ○*2 |
異常時の業務継続 ○:可、×:不可
*1 異常検出時は、ノングローバルゾーンを再起動して業務継続可
*2 異常検出時は、業務(クラスタアプリケーション)を再起動して業務継続可
図1.17 Oracle Solarisゾーン環境
監視対象の異常検出方法
物理パーティション
サーバのシステム監視機構と連携した非同期監視が、CPUやメモリ等の異常を契機とするパニック、およびリセットを即時検出し、待機系に切り替えます。
共用ディスク(ディスクアクセスパス)
ボリューム管理機能(GDS)と組み合わせることで、ディスクアクセスおよび、ディスクアクセスパスの故障を検出(Gdsリソースで監視)し、ディスクアクセス不可または、ディスクアクセスパスの全系故障の場合に待機系に切り替えます。
業務LAN
ネットワーク多重化機能(GLS)と組み合わせることで、業務LANのネットワークアダプタや経路の故障を検出(Glsリソースで監視)し、ネットワークの全系故障の場合に待機系に切り替えます。
OS(グローバルゾーン)
非同期監視により、OSのパニック、およびリセットを即時検出し、待機系に切り替えます。クラスタインタコネクト(LAN)定周期監視によりOSのハングアップを検出し、待機系に切り替えます。
OS(ノングローバルゾーン)
ノングローバルゾーンへのログイン(zloginコマンド)が可能かどうかを確認し、ログインエラーとなった場合に、待機系に切り替えます。
シングルノードクラスタの場合は、ノングローバルゾーンを再起動します。
業務(クラスタアプリケーション)
クラスタアプリケーションのリソース異常発生時に待機系に切り替えます。
シングルクラスタの場合は、ノングローバルゾーンを再起動します。
登録可能なリソースは以下の通りです。
Fsystemリソース:共用ディスク上に作成された切替えFile systemのリソース(ZFS/UFSが利用可能)
プロシジャリソース:Interstage, Systemwalker等、富士通ミドルウェア用のリソース
ISVリソース:Oracle, NetWorker等のISV製品のリソース(Wizard製品により提供)
プロセス監視リソース:利用者アプリケーション等、個別のプロセスリソース
Cmdlineリソース:利用者独自のスクリプト、コマンド等のリソース