ページの先頭行へ戻る
PRIMECLUSTER Global Link Services 説明書 4.3 (伝送路二重化機能編)

2.3.6 セルフチェック機能

GLSは、制御デーモンと仮想ドライバを使用して、伝送路の高信頼化を実現しています。

セルフチェック機能は定期的にこれらの状態を監視して、動作に異常が発生した場合、ユーザに異常を通知します。セルフチェック機能は自動的に有効になります。

図2.45 セルフチェック機能による監視

注意

セルフチェック機能ではシステム全体の異常やハングアップを検出することはできません。クラスタを使用してください。

セルフチェック機能の監視方法は以下のとおりです。定期的に仮想ドライバと制御デーモンを監視します。

図2.46 セルフチェック機能の異常検出

監視対象は以下のとおりです。なお、システム全体のハングアップや異常状態は検出できません。

監視対象

異常種別

異常検出方法

仮想ドライバ

ハングアップ検出

15秒間、仮想ドライバから応答がない

I/Oエラー検出

5回連続で仮想ドライバから情報を取得できない

制御デーモン

ハングアップ検出

300秒間、制御デーモンから応答がない

I/Oエラー検出

5回連続で制御デーモンから情報を取得できない

プロセス停止検出

制御デーモンのプロセスが存在しない

異常を検出した場合、以下のようなメッセージがシステムログに出力されます。その後、監視機能は停止します。再度、監視を開始する場合は、調査資料を採取後、システムをリブートしてください。

なお、以下の場所にスクリプトを配置することで異常を検出時にスクリプトを実行させることができます。詳細は、“3.6.10 ユーザコマンド実行機能の設定”を参照してください。

/etc/opt/FJSVhanet/script/system/monitor

参考

監視機能の停止後はシステムのリブートを推奨します。

一時的な負荷により、ハングアップまたはI/Oエラーを検出した場合は、以下のようにセルフチェック機能を再起動することで復旧できます。

# svcadm restart fjsvhanet-poll

セルフチェック機能の再起動に失敗した場合は、調査資料を採取し、当社技術員(SE)にエラーメッセージをお知らせください。

なお、セルフチェック機能の再起動に失敗した場合、システムのリソース不足や異常が発生している可能性があります。それらを解消するために、システムをリブートしてください。