異常時の対処について説明します。
運用中に通信異常が発生した場合、メッセージ“apc00001e”が通知されます。データベースサーバのダウンが通信異常の原因である場合は、切替えに成功した時点でメッセージ“apc00003i”が通知されます。長時間経過しても切替えに成功しない場合の対処については、“切替え時の通信異常時の対処”に従ってください。なお、切替えに成功した場合でも二重障害に備え、データベースサーバの状態を確認して原因を取り除いてください。
apc00001e:An error has occurred on the communication line to RDB system 'rdbsys1,host1'. apc00003i:Changed the communication endpoint of RDB system 'rdbsys1' to the host 'host2'.
apcstartコマンド実行時の通信回線の接続が失敗した場合、メッセージ“apc00004e”が通知されます。また、apcnetコマンドを使用して通信状態を表示した場合、Causeに“CON”と表示されます。これは通信回線接続の試行中であることを示します。通信回線の接続に成功すると、メッセージ“apc00005i”が通知されます。
apc00004e:Failed to connect the communication line with RDB system 'rdbsys1'. apc00005i:Successfully connected the communication line with RDB system 'rdbsys1'.
注意
通信回線の接続に失敗する原因としては、データベースサーバを起動していない、またはネットワーク環境に異常が発生していることが考えられます。長時間経過しても通信回線の接続に成功しない場合、データベースサーバの状態またはネットワーク環境を確認してください。
データベースサーバ上に監視プロセスを起動していない場合にも、通信回線の接続に失敗します。クラスタシステムを使用していない場合は、apcspvコマンドを使用して監視プロセスを起動してください。監視プロセスの起動については、“3.2.3 監視プロセスの起動と停止”を参照してください。
運用ノードで通信異常が発生した後、即時に待機ノードと通信再開できない場合、メッセージ“apc00002e”が通知されます。また、apcnetコマンドを使用して通信状態を表示した場合、Causeに“RTY”と表示されます。これは通信再開の試行中であることを示します。通信再開に成功すると、メッセージ“apc00003i”が通知されます。
apc00001e:An error has occurred on the communication line to RDB system 'rdbsys1,host1'. apc00002e:Failed to communicate with the alternate of RDB system 'rdbsys1'. apc00003i:Changed the communication endpoint of RDB system 'rdbsys1' to the host 'host2'.
注意
通信再開に失敗する原因としては、データベースサーバの切替えの失敗、またはネットワーク環境に異常が発生していることが考えられます。長時間経過しても通信再開に成功しない場合、データベースサーバの状態またはネットワーク環境を確認してください。
データベースサーバの運用ノードとは通信可能な状態であるが、待機ノードとは通信不可能な状態の場合、メッセージ“apc00006e”が通知されます。これは、apcstartコマンド実行時に待機ノードとの通信回線の接続に失敗した場合、または、切替え後の新たな待機ノードとの通信回線の接続に失敗した場合など、待機ノードだけで通信異常が発生した場合に該当します。また、apcnetコマンドを使用して通信状態を表示した場合、待機ノードのCauseに“CON”と表示されます。これは運用ノードと通信可能な状態であり、かつ待機ノードと通信回線接続の試行中であることを示します。待機ノードとの通信回線の接続に成功すると、メッセージ“apc00007i”が通知されます。
apc00006e:An error has occurred on the communication line to the standby instance of RDB system 'rdbsys1'. apc00007i:The communication line to the standby instance of RDB system 'rdbsys1' has been restored.
通信異常の原因として、データベースサーバの停止、ダウン、またはネットワーク環境の物理的、論理的な異常が考えられます。たとえばネットワーク環境の論理的な異常には以下があります。通信異常が発生した場合は、アプリケーションサーバまたはデータベースサーバに出力されるメッセージを確認し、メッセージの利用者の対処に従ってください。
データベースサーバの環境設定の誤り
アプリケーションサーバの環境設定の誤り
データベースサーバのメモリ不足
アプリケーションサーバのメモリ不足
運用中にRDBシステムの通信異常が発生した場合、メッセージ“apc00001e”が通知されます。ロードシェア運用を行っている場合、通信異常が発生したノードと通信再開を試みます。このとき即時に通信再開できない場合、メッセージ“apc00002e”が通知されます。また、apcnetコマンドを使用してRDBシステムの通信状態を表示した場合、Causeに“RTY”と表示されます。これは通信再開の試行中であることを示します。通信再開に成功した時点でメッセージ“apc00003i”が通知されます。
apc00001e:An error has occurred on the communication line to RDB system 'rdbsys1,host1'.
apc00002e:Failed to communicate with the alternate of RDB system 'rdbsys1'.
apc00003i:Changed the communication endpoint of RDB system 'rdbsys1' to the host 'host1'.
注意
通信異常の復旧作業を行っても通信再開に成功しない場合は、データベースサーバの状態またはネットワーク環境に問題がないか再確認してください。
apcstartコマンド実行時の通信回線の接続が失敗した場合、メッセージ“apc00004e”が通知されます。また、apcnetコマンドを使用してRDBシステムの通信状態を表示した場合、Causeに“CON”と表示されます。これは通信回線接続の試行中であることを示します。通信回線の接続に成功すると、メッセージ“apc00005i”が通知されます。
apc00004e:Failed to connect the communication line with RDB system 'rdbsys1'. apc00005i:Successfully connected the communication line with RDB system 'rdbsys1'.
注意
通信回線の接続に失敗する原因としては、データベースサーバを起動していない、またはネットワーク環境に異常が発生していることが考えられます。長時間経過しても通信回線の接続に成功しない場合、データベースサーバの状態またはネットワーク環境を確認してください。
データベースサーバ上に監視プロセスを起動していない場合にも、通信回線の接続に失敗します。クラスタシステムを使用していない場合は、apcspvコマンドを使用して監視プロセスを起動してください。監視プロセスの起動については、“3.2.3 監視プロセスの起動と停止”を参照してください。
運用中にロググループの通信異常が発生した場合、メッセージ“apc00042e”が通知されます。ロードシェア運用を行っている場合、通信異常が発生したロググループと通信再開を試みます。このとき即時に通信再開できない場合、メッセージ“apc00043e”が通知されます。また、apcnetコマンドを使用してロググループの通信状態を表示した場合、Causeに“RTY”と表示されます。これは通信再開の試行中であることを示します。通信再開に成功した時点でメッセージ“apc00044i”が通知されます。
apc00042e:An error has occurred on the communication line to RDB system 'grp1,host1'.
apc00042e:An error has occurred on the communication line to RDB system 'grp2,host1'
apc00043e:Failed to communicate with the alternate of RDB system 'grp1'.
apc00043e:Failed to communicate with the alternate of RDB system 'grp2'.
apc00044i:Changed the communication endpoint of RDB system 'grp1' to the host 'host2'.
apc00044i:Changed the communication endpoint of RDB system 'grp2' to the host 'host3'.
注意
通信再開に成功しない場合の対処方法については“ロググループの通信異常の原因について”を参照してください。
apcstartコマンド実行時にロググループの通信異常が発生した場合、メッセージ“apc00045e”が通知されます。また、apcnetコマンドを使用してロググループの通信状態を表示した場合、Causeに“CON”と表示されます。これは通信開設の試行中であることを示します。通信開設に成功すると、メッセージ“apc00046i”が通知されます。
apc00045e:Failed to connect the communication line with RDB system 'grp1'. apc00046i:Successfully connected the communication line with RDB system 'grp1'.
注意
通信開設に成功しない場合の対処方法については“ロググループの通信異常の原因について”を参照してください。
RDBシステムの通信異常の原因として、データベースサーバの停止、ダウン、またはネットワーク環境の物理的、論理的な異常が考えられます。たとえばネットワーク環境の論理的な異常には以下があります。通信異常が発生した場合は、アプリケーションサーバまたはデータベースサーバに出力されるメッセージを確認し、メッセージの利用者の対処に従ってください。
データベースサーバの環境設定の誤り
アプリケーションサーバの環境設定の誤り
データベースサーバのメモリ不足
アプリケーションサーバのメモリ不足
RDBシステムと通信可能であるがロググループと通信不可能な場合は、ロググループの通信異常になります。通信異常の原因として、データベースサーバの縮退発生、ロググループの切り戻し処理中が考えられます。通信異常が長時間継続する場合はデータベースサーバ側でロググループの状態を確認してください。なお、RDBシステムおよびロググループの通信状態はapcnetコマンドで確認することができます。