ページの先頭行へ戻る
Interstage Shunsaku Data Manager トラブルシューティング集

1.6.2 searcherのフェイルオーバからの復旧

searcherのフェイルオーバの復旧手順について、以下に示します。


代替searcher切替え時の復旧

searcherのフェイルオーバが発生すると、ディレクタサーバのイベントログまたはシステムログ(syslog)に、以下のメッセージが出力されます。


shn01903i: Searcher connection was broken. (192.168.10.1,23501) (director) [shund1] Shunsaku System Name=shunsaku
shn01904i: Switching to alternative searcher. (director) [shund1] Shunsaku System Name=shunsaku
shn01110i: Connected to searcher. (192.168.10.20,23501) (director) [shund1] Shunsaku System Name=shunsaku

復旧手順

異常が発生したsearcherとフェイルオーバにより稼働中の代替searcherを元の構成に戻す場合には、異常が発生したsearcherの復旧後に以下の手順で行います。


  1. 復旧が完了したsearcherを配置したサーバでshunsysstartコマンドを実行し、searcherを起動します。

    shunsysstart   -n  Shunsakuシステム名

    復旧が完了したsearcherを起動すると、稼働中の代替searcher内のサーチデータが復旧が完了したsearcherに自動的に再配信されます。

    再配信が完了すると、稼働中の代替searcherは、代替待機状態となり、ほかのsearcher異常に備えます。


    稼働中の代替searcherからの自動再配信中は、以下の操作が実行できません。

    • アプリケーションによる更新操作

    • shundbackupコマンド

    • shundcdsコマンド

    • shundclearコマンド

    • shundexportコマンド

    • shundimportコマンド

    • shundrecoverコマンド

    • shundresendコマンド

    • shundrestrictコマンド

    • shunsyscfgeditコマンド

    • shunsysstopコマンド


以上により、システムが元の構成に戻り、フェイルオーバ運用が再開されます。

searcher接続待ち状態からの復旧

縮退可能なsearcher数(DegradableSearcherCntパラメタ)を指定した運用で、指定値を超える数のsearcher(注)で異常が発生した場合、ディレクタサーバのシステムログ(syslog)またはイベントログに、以下のメッセージが出力され、searcher接続待ちの状態に移行します。

注)代替searcherへ切り替わった数は、異常searcher数には含まれません。


shn01906w: Searchers to operate are insufficient. Number of searchers =18 (director) [shund1] Shunsaku System Name=shunsaku

復旧手順

  1. shundstateコマンドを実行し、directorの稼動状況(State)が“WAITING”であることを確認します。

    shundstate -s director識別子

  2. shundstateコマンドにpオプションを指定し、searcherの稼動状況(State)が“INACTIVE”のsearcherを確認します。
    その際、使用しているsearcherと代替searcherの一覧情報を用意しておくと、確認が容易になります。

    shundstate -s director識別子 -p

  3. 2.で確認した稼動状態が“INACTIVE”の全searcherについて、異常を取り除いたあと、searcherを配置したサーチサーバでshunsysstartコマンドを実行し、searcherを起動します。

    shunsysstart -n Shunsakuシステム名

  4. 異常が発生したすべてのディレクタサーバでshundstateコマンドを実行し、directorの稼動状況(State)が“ACTIVE”になるまで待ちます。


縮退が発生していた場合には、引き続き縮退からの復旧作業を行います。

詳細は、“1.4.1 異常状態からの復旧手順”を参照してください。