ページの先頭行へ戻る
PRIMECLUSTER Wizard 4.4 for SAP HANA(R) 導入運用手引書
FUJITSU Software

3.1.5 クラスタシステム異常時の切替え

クラスタシステムの運用中に、以下の異常が発生した場合の対処方法について説明します。

プライマリシステムとして動作するノードで異常が発生した場合

異常が発生したプライマリシステムとして動作するノードでは、userApplication の状態が Online から Faulted になります。

クラスタ切替えが自動で行われ、セカンダリシステムとして動作していたノード上で userApplication の状態が Standby から Online になります。また、セカンダリシステムからプライマリシステムに処理が引き継がれます。

上記の状態は、以下のコマンドで確認できます。

node2# hvdisp -T userApplication

Local System:  node2RMS
Configuration: /opt/SMAW/SMAWRrms/build/config.us

Resource            Type       HostName         State        StateDetails
-----------------------------------------------------------------------------
hanaprd             userApp                     Online
node1# hvdisp -T userApplication

Local System: node1RMS Configuration: /opt/SMAW/SMAWRrms/build/config.us Resource Type HostName State StateDetails ----------------------------------------------------------------------------- hanaprd userApp Faulted Failed Over hanaprd userApp node2RMS Online

以下の手順で原因を取り除いたあと、異常が発生したノードをセカンダリシステムとして動作させます。

  1. 原因を調査し、異常を取り除きます。

    原因の調査では、syslog やPRIMECLUSTERのアプリケーションログを参照することで、ハードウェアの異常を示すメッセージや、 SAP HANA コマンドが出力したメッセージから調査してください。

  2. 復旧したクラスタノードで Faulted 状態をクリアし、userApplicationをStandby状態にします。

    SAP HANA のデータベースのサイズによっては userApplicationがWait状態からStandby状態になるまでに時間を要する場合があります。

    node1# hvutil -c hanaprd
    node1# hvdisp -T userApplication
    
    Local System:  node1RMS
    Configuration: /opt/SMAW/SMAWRrms/build/config.us
    
    Resource            Type       HostName         State        StateDetails
    -----------------------------------------------------------------------------
    hanaprd             userApp                     Standby
    hanaprd             userApp    node2RMS         Online

必要に応じて、異常から復旧したノードをプライマリシステムに戻してください。その場合の手順については、“3.1.4 プライマリシステムからセカンダリシステムへの手動引継ぎ”を参照してください。

セカンダリシステムとして動作するノードで異常が発生した場合

異常が発生したノードでは userApplication の状態は Faulted になります。

node2# hvdisp -T userApplication

Local System:  node2RMS
Configuration: /opt/SMAW/SMAWRrms/build/config.us

Resource            Type       HostName         State        StateDetails
-----------------------------------------------------------------------------
hanaprd             userApp                     Faulted      Offline Success
hanaprd             userApp    node1RMS         Online

以下の手順を行います。

  1. 原因を調査し、異常を取り除きます。

    原因の調査では、syslog やPRIMECLUSTERのアプリケーションログを参照することで、ハードウェアの異常を示すメッセージや、 SAP HANA コマンドが出力したメッセージから調査してください。

  2. 復旧したノードで Faulted 状態をクリアし、 userApplication を Standby 状態にします。

    SAP HANA のデータベースのサイズによっては userApplicationがWait状態からStandby状態になるまでに時間を要する場合があります。

    node2# hvutil -c hanaprd
    node2# hvdisp -T userApplication
    
    Local System:  node2RMS
    Configuration: /opt/SMAW/SMAWRrms/build/config.us
    
    Resource            Type       HostName         State        StateDetails
    -----------------------------------------------------------------------------
    hanaprd             userApp                     Standby
    hanaprd             userApp    node1RMS         Online
  3. FullSync 自動有効化ファイルを作成済みの場合、PRIMECLUSTER Wizard for SAP HANA によって Full Sync が有効化されます。

    FullSync 自動有効化ファイルを作成せず、Full Sync を有効化する場合は、SAP HANA がプライマリシステムとして動作しているノードで hdbnsutil -sr_fullsync --enable コマンドを実行します。

    node1# su - prdadm -c 'hdbnsutil -sr_fullsync --enable'

プライマリシステムとセカンダリシステムの双方のノードで異常が発生した場合

双方のノードで userApplication の状態は Faulted になります。

node1# hvdisp -T userApplication

Local System: node1RMS
Configuration: /opt/SMAW/SMAWRrms/build/config.us

Resource            Type       HostName         State        StateDetails
-----------------------------------------------------------------------------
hanaprd             userApp                     Faulted      Failed Over
node2# hvdisp -T userApplication

Local System:  node2RMS
Configuration: /opt/SMAW/SMAWRrms/build/config.us

Resource            Type       HostName         State        StateDetails
-----------------------------------------------------------------------------
hanaprd             userApp                     Faulted      Offline Success

以下の手順を行います。

  1. 原因を調査し、異常を取り除きます。

    原因の調査では、syslog やPRIMECLUSTERのアプリケーションログを参照することで、ハードウェアの異常を示すメッセージや、 SAP HANA コマンドが出力したメッセージから調査してください。

  2. プライマリシステムとして動作するノードで userApplication を Offline 状態にします。

    node1# hvutil -f hanaprd
    node1# hvdisp -T userApplication
    
    Local System:  node1RMS
    Configuration: /opt/SMAW/SMAWRrms/build/config.us
    
    Resource            Type       HostName         State        StateDetails
    -----------------------------------------------------------------------------
    hanaprd             userApp                     Offline
  3. プライマリシステムとして動作するノードで Full Sync が有効となっている場合は、解除します。

    そのあと、userApplication を Online 状態にします。

    node1# su - prdadm -c 'hdbnsutil -sr_fullsync --disable'
    node1# hvswitch hanaprd node1RMS
    node1# hvdisp -T userApplication
    
    Local System:  node1RMS
    Configuration: /opt/SMAW/SMAWRrms/build/config.us
    
    Resource            Type       HostName         State        StateDetails
    -----------------------------------------------------------------------------
    hanaprd             userApp                     Online
  4. セカンダリシステムとして動作するノードで Faulted 状態をクリアし、userApplication を Standby 状態にします。

    SAP HANA のデータベースのサイズによっては userApplicationがWait状態からStandby状態になるまでに時間を要する場合があります。

    node2# hvutil -c hanaprd
    node2# hvdisp -T userApplication
    
    Local System:  node2RMS
    Configuration: /opt/SMAW/SMAWRrms/build/config.us
    
    Resource            Type       HostName         State        StateDetails
    -----------------------------------------------------------------------------
    hanaprd             userApp                     Standby
    hanaprd             userApp    node1RMS         Online
  5. Full Sync を有効化します。

    • FullSync 自動有効化ファイルを作成済みの場合

      PRIMECLUSTER Wizard for SAP HANA によって Full Sync が有効化されます。

    • FullSync 自動有効化ファイルを作成せず、Full Sync を有効化する場合

      SAP HANA がプライマリシステムとして動作しているノードで hdbnsutil -sr_fullsync --enable コマンドを実行します。

      node1# su - prdadm -c 'hdbnsutil -sr_fullsync --enable'