クラスタシステムの運用中に、以下の異常が発生した場合の対処方法について説明します。
プライマリシステムとして動作するノードで異常が発生した場合
異常が発生したプライマリシステムとして動作するノードでは、userApplication の状態が Online から Faulted になります。
クラスタ切替えが自動で行われ、セカンダリシステムとして動作していたノード上で userApplication の状態が Standby から Online になります。また、セカンダリシステムからプライマリシステムに処理が引き継がれます。
上記の状態は、以下のコマンドで確認できます。
node2# hvdisp -T userApplication Local System: node2RMS Configuration: /opt/SMAW/SMAWRrms/build/config.us Resource Type HostName State StateDetails ----------------------------------------------------------------------------- hanaprd userApp Online
node1# hvdisp -T userApplication
Local System: node1RMS Configuration: /opt/SMAW/SMAWRrms/build/config.us Resource Type HostName State StateDetails ----------------------------------------------------------------------------- hanaprd userApp Faulted Failed Over hanaprd userApp node2RMS Online
以下の手順で原因を取り除いたあと、異常が発生したノードをセカンダリシステムとして動作させます。
原因を調査し、異常を取り除きます。
原因の調査では、syslog やPRIMECLUSTERのアプリケーションログを参照することで、ハードウェアの異常を示すメッセージや、 SAP HANA コマンドが出力したメッセージから調査してください。
復旧したクラスタノードで Faulted 状態をクリアし、userApplicationをStandby状態にします。
SAP HANA のデータベースのサイズによっては userApplicationがWait状態からStandby状態になるまでに時間を要する場合があります。
node1# hvutil -c hanaprd node1# hvdisp -T userApplication Local System: node1RMS Configuration: /opt/SMAW/SMAWRrms/build/config.us Resource Type HostName State StateDetails ----------------------------------------------------------------------------- hanaprd userApp Standby hanaprd userApp node2RMS Online
必要に応じて、異常から復旧したノードをプライマリシステムに戻してください。その場合の手順については、“3.1.4 プライマリシステムからセカンダリシステムへの手動引継ぎ”を参照してください。
セカンダリシステムとして動作するノードで異常が発生した場合
異常が発生したノードでは userApplication の状態は Faulted になります。
node2# hvdisp -T userApplication Local System: node2RMS Configuration: /opt/SMAW/SMAWRrms/build/config.us Resource Type HostName State StateDetails ----------------------------------------------------------------------------- hanaprd userApp Faulted Offline Success hanaprd userApp node1RMS Online
以下の手順を行います。
原因を調査し、異常を取り除きます。
原因の調査では、syslog やPRIMECLUSTERのアプリケーションログを参照することで、ハードウェアの異常を示すメッセージや、 SAP HANA コマンドが出力したメッセージから調査してください。
復旧したノードで Faulted 状態をクリアし、 userApplication を Standby 状態にします。
SAP HANA のデータベースのサイズによっては userApplicationがWait状態からStandby状態になるまでに時間を要する場合があります。
node2# hvutil -c hanaprd node2# hvdisp -T userApplication Local System: node2RMS Configuration: /opt/SMAW/SMAWRrms/build/config.us Resource Type HostName State StateDetails ----------------------------------------------------------------------------- hanaprd userApp Standby hanaprd userApp node1RMS Online
FullSync 自動有効化ファイルを作成済みの場合、PRIMECLUSTER Wizard for SAP HANA によって Full Sync が有効化されます。
FullSync 自動有効化ファイルを作成せず、Full Sync を有効化する場合は、SAP HANA がプライマリシステムとして動作しているノードで hdbnsutil -sr_fullsync --enable コマンドを実行します。
node1# su - prdadm -c 'hdbnsutil -sr_fullsync --enable'
プライマリシステムとセカンダリシステムの双方のノードで異常が発生した場合
双方のノードで userApplication の状態は Faulted になります。
node1# hvdisp -T userApplication Local System: node1RMS Configuration: /opt/SMAW/SMAWRrms/build/config.us Resource Type HostName State StateDetails ----------------------------------------------------------------------------- hanaprd userApp Faulted Failed Over
node2# hvdisp -T userApplication Local System: node2RMS Configuration: /opt/SMAW/SMAWRrms/build/config.us Resource Type HostName State StateDetails ----------------------------------------------------------------------------- hanaprd userApp Faulted Offline Success
以下の手順を行います。
原因を調査し、異常を取り除きます。
原因の調査では、syslog やPRIMECLUSTERのアプリケーションログを参照することで、ハードウェアの異常を示すメッセージや、 SAP HANA コマンドが出力したメッセージから調査してください。
プライマリシステムとして動作するノードで userApplication を Offline 状態にします。
node1# hvutil -f hanaprd node1# hvdisp -T userApplication Local System: node1RMS Configuration: /opt/SMAW/SMAWRrms/build/config.us Resource Type HostName State StateDetails ----------------------------------------------------------------------------- hanaprd userApp Offline
プライマリシステムとして動作するノードで Full Sync が有効となっている場合は、解除します。
そのあと、userApplication を Online 状態にします。
node1# su - prdadm -c 'hdbnsutil -sr_fullsync --disable'
node1# hvswitch hanaprd node1RMS node1# hvdisp -T userApplication Local System: node1RMS Configuration: /opt/SMAW/SMAWRrms/build/config.us Resource Type HostName State StateDetails ----------------------------------------------------------------------------- hanaprd userApp Online
セカンダリシステムとして動作するノードで Faulted 状態をクリアし、userApplication を Standby 状態にします。
SAP HANA のデータベースのサイズによっては userApplicationがWait状態からStandby状態になるまでに時間を要する場合があります。
node2# hvutil -c hanaprd node2# hvdisp -T userApplication Local System: node2RMS Configuration: /opt/SMAW/SMAWRrms/build/config.us Resource Type HostName State StateDetails ----------------------------------------------------------------------------- hanaprd userApp Standby hanaprd userApp node1RMS Online
Full Sync を有効化します。
FullSync 自動有効化ファイルを作成済みの場合
PRIMECLUSTER Wizard for SAP HANA によって Full Sync が有効化されます。
FullSync 自動有効化ファイルを作成せず、Full Sync を有効化する場合
SAP HANA がプライマリシステムとして動作しているノードで hdbnsutil -sr_fullsync --enable コマンドを実行します。
node1# su - prdadm -c 'hdbnsutil -sr_fullsync --enable'