ページの先頭行へ戻る
PRIMECLUSTER  コンセプトガイド 4.7

1.8.1 Linux

Linuxで、以下の環境の場合のクラスタシステムの可用性について説明します。

1.8.1.1 物理、仮想環境の場合

Linuxで、以下の環境の場合のクラスタシステムの可用性について説明します。

以下の表では、各監視対象の異常検出の可否についてまとめています。

表1.1 クラスタシステム構成別の可用性 (物理、仮想環境の場合)

監視対象

物理サーバ

KVM

RHOSP

VMware

管理OS異常切替機能を使用した
クラスタ

異なる管理OS上のゲストOS間
クラスタ

同一管理OS上のゲストOS間
クラスタ

異なるコンピュートノード上のゲストOS間クラスタ

同一コンピュートノード上のゲストOS間クラスタ

異なるESXiホスト上のゲストOS間
クラスタ

同一ESXiホスト上のゲストOS間
クラスタ

1. 筐体

×

×

○*1

×

○*2

×

2. 共用ディスクおよびディスクアクセスパス

×

×

×

3. 業務LAN

×

×

×

4. OS(物理、管理OS/ESXiホスト)

×

×

○*1

×

○*2

×

5. OS(ゲストOS)

○*3

○*4

6. 業務(クラスタアプリケーション)

異常時の業務継続 ○:可、×:不可、-:対象外

*1 コンピュートインスタンスの高可用設定により業務継続可能
コンピュートインスタンスの高可用設定の詳細については、“Red Hat OpenStack Platform コンピュートインスタンスの高可用性”を参照してください

*2 I/Oフェンシング機能使用時、または、VMware vCenter Server連携機能とVMware vSphere HA使用時
ゲストOSのハングアップを検出しゲストOSを待機系に自動切替えできない場合は、LEFTCLUSTERとなります

*3 ゲストOSを待機系に自動切替えできない場合は、LEFTCLUSTERとなります

*4 VMware vCenter Server連携機能使用時のみ自動切替え可能となります

図1.17 物理環境

図1.18 仮想環境

RHOSP環境の場合、管理OSをコンピュートノードと、VMware環境の場合、管理OSをESXiホストと読み替えてください。

監視対象の異常検出方法

  1. 筐体

    PRIMEQUEST 3000の場合はiRMC/MMBと連携した非同期監視機能が、CPUやメモリ等の異常を契機とするパニック、およびリセットを即時検出し、待機系に切り替えます。PRIMERGYおよび仮想環境の場合、ハートビート監視で異常を検出し、待機系に切り替えます。*1

  2. 共用ディスクおよびディスクアクセスパス

    ボリューム管理機能(GDS)と組み合わせることで、ディスクアクセスおよび、ディスクアクセスパスの故障を検出(Gdsリソースで監視)し、ディスクアクセス不可または、ディスクアクセスパスの全系故障の場合に待機系に切り替えます。

  3. 業務LAN

    ネットワーク多重化機能(Global Link Services。以降、GLS)と組み合わせることで、業務LANのネットワークアダプタや経路の故障を検出(Glsリソースで監視)し、ネットワークの全系故障の場合に待機系に切り替えます。

  4. OS(物理、管理OS/ESXiホスト)

    ハートビート監視で異常を検出し、待機系に切り替えます。*1

  5. OS(ゲストOS)

    ハートビート監視で異常を検出し、待機系に切り替えます。

  6. 業務(クラスタアプリケーション)

    クラスタアプリケーションのリソース異常発生時に待機系に切り替えます。

*1 異なる管理OS上のゲスト間クラスタ(RHOSP、VMware)の場合、LEFTCLUSTERとなります。コンピュートインスタンスの高可用設定(RHOSP)やvSphere HA機能(VMware)により、ゲストOSが再起動することで、LEFTCLUSTER状態が自動的に解消され、待機系に切り替わります。

1.8.1.2 クラウド環境の場合

Linuxで、以下の環境の場合のクラスタシステムの可用性について説明します。

以下の表では、各監視対象の異常検出の可否についてまとめています。

表1.2 クラスタシステム構成別の可用性 (クラウド環境の場合)

監視対象

FJcloud-O

ニフクラ

FJcloud-ベアメタル

AWS

Azure

ゲストOS間クラスタ

マルチゾーンでのクラスタ

シングルゾーンでのクラスタ

ベアメタルサーバ間クラスタ

マルチアベイラビリティゾーン (Multi-AZ) でのクラスタ

シングルアベイラビリティゾーン (Single-AZ) でのクラスタ

マルチアベイラビリティゾーンでのクラスタ

シングルアベイラビリティゾーンでのクラスタ

1. AZ/ゾーン

×

○ *1

×

- *2

×

○ *1

×

2. ディスク

3. 業務LAN

4. OS(ゲストOS)

5. 業務(クラスタアプリケーション)

6. ベアメタルサーバ

異常時の業務継続 ○:可、×:不可、-:対象外

*1 AZ(Azure)または、ゾーン(ニフクラ)の異常を検出し、LEFTCLUSTERとします。LEFTCLUSTER状態を回復させることで業務を継続させます。LEFTCLUSTER状態からの回復手順については、“PRIMECLUSTER Cluster Foundation 導入運用手引書”を参照してください。

*2 FJcloud-ベアメタル環境が提供されている東日本リージョン3、西日本リージョン3には、AZがありません。

図1.19 FJcloud-O環境

監視対象の異常検出方法

  1. AZ

    AZは監視対象外です。

  2. ディスク

    ボリューム管理機能(GDS)と組み合わせることで、ディスクアクセスの異常を検出(Gdsリソースで監視)し、ディスクアクセス不可の場合に待機系に切り替えます。

  3. 業務LAN

    ネットワーク多重化機能(GLS)と組み合わせることで、業務LANのネットワークアダプタや経路の故障を検出(Glsリソースで監視)し、ネットワークの全系故障の場合に待機系に切り替えます。

  4. OS(ゲストOS)

    ハートビート監視で異常を検出し、待機系に切り替えます。

  5. 業務(クラスタアプリケーション)

    クラスタアプリケーションのリソース異常発生時に待機系に切り替えます。

図1.20 ニフクラ環境

監視対象の異常検出方法

  1. ゾーン

    クラスタインタコネクト定周期監視によりゾーンの異常を検出し、LEFTCLUSTERとします。

  2. ディスク

    GDSがディスクへのI/Oを監視し、ディスクアクセスの異常発生時にディスクを切り離し、業務を継続します。

    ミラーを構成するすべてのスライスでI/Oエラーが発生した場合は、待機系に自動切替えします。

  3. 業務LAN

    ICMPを利用したネットワーク疎通監視により経路の故障を検出し、待機系に自動切替えします。

  4. OS(ゲストOS)

    クラスタインタコネクト定周期監視によりゲストOS異常を検出し、待機系に自動切替えします。

  5. 業務(クラスタアプリケーション)

    クラスタアプリケーションのリソース異常発生時に待機系に自動切替えします。

図1.21 FJcloud-ベアメタル環境

監視対象の異常検出方法

2. ディスク

ボリューム管理機能(GDS)と組み合わせることで、ディスクアクセスの異常を検出(Gdsリソースで監視)し、ディスクアクセス不可の場合に待機系に切り替えます。

3. 業務LAN

ネットワーク多重化機能(GLS)と組み合わせることで、業務LANのネットワークアダプタや経路の故障を検出(Glsリソースで監視)し、ネットワークの全系故障の場合に待機系に切り替えます。

4. OS(ゲストOS)

ハートビート監視で異常を検出し、待機系に切り替えます。

5. 業務(クラスタアプリケーション)

クラスタアプリケーションのリソース異常発生時に待機系に切り替えます。

6. ベアメタルサーバ

ハートビート監視で異常を検出し、待機系に切り替えます。

参照

VMwareを使用する場合は、“1.8.1.1 物理、仮想環境の場合”を参照してください。

図1.22 AWS環境

監視対象の異常検出方法

  1. AZ

    ハートビート監視で異常を検出し、自動切替えします。

  2. ディスク

    ボリューム管理機能(GDS)と組み合わせることで、ディスクアクセスの異常を検出(Gdsリソースで監視)し、ディスクアクセス不可の場合に待機系に切り替えます。

  3. 業務LAN

    制御用のスクリプトをCmdlineリソースに登録することで、経路の故障を検出し、ネットワーク故障時に待機系に切り替えます。

  4. OS(ゲストOS)

    ハートビート監視で異常を検出し、待機系に切り替えます。

  5. 業務(クラスタアプリケーション)

    クラスタアプリケーションのリソース異常発生時に待機系に切り替えます。

図1.23 Azure環境

監視対象の異常検出方法

  1. AZ

    ハートビート監視で異常を検出し、LEFTCLUSTERにします。

  2. ディスク

    ボリューム管理機能(GDS)と組み合わせることで、ディスクアクセスの異常を検出(Gdsリソースで監視)し、ディスクアクセス不可の場合に待機系に切り替えます。

  3. 業務LAN

    制御用のスクリプトをCmdlineリソースに登録することで、経路の故障を検出し、ネットワーク故障時に待機系に切り替えます。

  4. OS(ゲストOS)

    ハートビート監視で異常を検出し、待機系に切り替えます。

  5. 業務(クラスタアプリケーション)

    クラスタアプリケーションのリソース異常発生時に待機系に切り替えます。