ページの先頭行へ戻る
Interstage Information StorageV10.0.0 運用ガイド

2.8.1 障害の検出からリカバリまでの手順

資源管理の管理領域の媒体に入出力障害が発生した場合、システムメッセージ“qdg13039u”が出力されます。

媒体障害が発生した場合のリカバリは、資源管理の管理領域を割り付けているデバイスによって異なります。本節では、以下のデバイスごとに媒体障害が発生した場合の、障害の検出からリカバリまでの手順を説明します。

参照

各操作で使用するコマンドの詳細については、“コマンドリファレンス”を参照してください。


2.8.1.1 資源管理の管理領域をローデバイスに割り付けている場合のリカバリ

資源管理の管理領域を、ローデバイスに割り付けている場合のリカバリ操作は、以下の手順で行います。

1.システムメッセージの確認および影響範囲の特定

2. 資源管理の管理領域の切離し

3. 障害ディスクのリカバリ

4. 切り離した資源管理の管理領域の接続

5. アクセス禁止の設定

6. 管理領域のリカバリ


  1. システムメッセージの確認および影響範囲の特定

    資源管理のアクセス中に媒体障害が発生した場合、資源管理は、以下のメッセージを出力します。このメッセージから、媒体障害が発生した資源管理の管理領域名および資源管理の管理領域が割り付けられているローデバイス名を確認してください。

    この例では、媒体障害が発生したローデバイスは、/dev /raw10だと特定することができます。

    rdb: ERROR: qdg13039u:データベーススペースのデバイスに異常を
      検出しました DB名='INFOSTORAGEDB' DBS名='STDBSP001' デバイス名=  '/dev /raw10' 物理ブロック番号='99' 原因コード='1'  調査コード='2 0 '  
    rdb: ERROR: qdg03650u:入出力障害のためデータベースをアクセス 
      禁止状態にしました DB名='INFOSTORAGEDB' DSI名=' CATEGORYEXCLUSIVE_TDSI '
      ページ番号='10' DBS名='STDBSP001' 物理ブ ロック番号='99'
    

    また、資源管理では、ディスク間欠障害の検査を行っています。ディスク間欠障害を検出した場合、CE保守情報をRDB構成パラメタファイルのRDBCOREで指定したディレクトリの以下のファイルに出力します。ディスク間欠障害が検出されたディスクを交換する場合は、これらのファイルの情報から障害ディスクを特定します。

    • pagedump_内部時間情報

    • pageinf_内部時間情報


  2. 資源管理の管理領域の切離し

    資源管理の管理領域は、ディスク上に作成したローデバイスに割り付けられています。媒体障害からのリカバリを行うためにはディスクを交換します。交換作業を行う間、資源管理から一時的にすべての資源管理の管理領域を切り離します。切り離されたすべての資源管理の管理領域には、アクセス禁止状態が設定されます。資源管理の管理領域の切離しは、rdbexspcコマンドのmdetachオプションにより行います。

    rdbexspcコマンドの対象となる資源管理の管理領域名はセットアップ時の情報を参考にしてください。

    $ rdbexspc -mdetach -p INFOSTORAGEDB.STDBSP001
    $ rdbexspc -mdetach -p INFOSTORAGEDB.STDBSP002
    $ rdbexspc -mdetach -p INFOSTORAGEDB.STDBSP003
    $ rdbexspc -mdetach -p INFOSTORAGEDB.STDBSP004

  3. 障害ディスクのリカバリ

    富士通CEによるディスクの交換を行ったあと、資源管理のリカバリ操作を行う前に、ボリュームの構成情報をリカバリしてください。

    ボリュームの構成情報のリカバリは、事前に作成しておいたudevのブロックデバイスとディスクパーティションの情報に従って、partedコマンドを使用しパーティションを再作成してください。

    参照

    ローデバイスの作成については“導入ガイド”の"6.2 ローデバイスの作成"を参照してください。


  4. 切り離した資源管理の管理領域の接続

    ディスク交換前に切り離した資源管理の管理領域を、資源管理に接続します。

    資源管理の管理領域の接続は、rdbexspcコマンドのmattachオプションにより行います。

    なお、rdbexspcコマンドは資源管理の管理領域の切離し時に指定したすべての資源管理の管理領域名に対して行ってください。

    $ rdbexspc -mattach -p INFOSTORAGEDB.STDBSP001
    $ rdbexspc -mattach -p INFOSTORAGEDB.STDBSP002
    $ rdbexspc -mattach -p INFOSTORAGEDB.STDBSP003
    $ rdbexspc -mattach -p INFOSTORAGEDB.STDBSP004

  5. アクセス禁止の設定

    リカバリを行うために、資源管理の管理領域をアクセス禁止状態にします。

    アクセス禁止状態にするには"2.5.3.2 バックアップ用リストファイルの作成"で作成したアクセス禁止リストファイルが必要です。

    以下の例では、アクセス禁止リストファイル"/home/rdb1/dsi_inh.list"を使用して、資源管理の管理領域にアクセス禁止を設定しています。

    $ rdbinh -f /home/rdb1/dsi_inh.list

  6. 管理領域のリカバリ

    資源管理の管理領域を、rdbrcvコマンドによりリカバリします。

    リカバリには”2.5.3資源管理のバックアップ”で作成したバックアップ用リストファイルと、バックアップ取得後に退避したすべてのアーカイブログが必要です。

    以下の例ではバックアップ用リストファイル”/home/rdb1/dsi.list”とバックアップ後に退避したアーカイブログ”/backup/arch001”を使用してリカバリしています。

    $ rdbrcv -F -t /home/rdb1/dsi.list -w /home/rdb1/work -a arch001@/backup

2.8.1.2 資源管理の管理領域をファイルに割り付けている場合のリカバリ

資源管理の管理領域を、ファイルに割り付けている場合のリカバリ操作は、以下の手順で行います。

1. システムメッセージの確認および影響範囲の特定

2. 資源管理の管理領域の切離し

3. 障害ディスクのリカバリ

4. 切り離した資源管理の管理領域の接続

5. アクセス禁止の設定

6. 管理領域のリカバリ


  1. システムメッセージの確認および影響範囲の特定

    資源管理のアクセス中に媒体障害が発生した場合、資源管理は、以下のメッセージを出力します。このメッセージから、媒体障害が発生した資源管理の管理領域名および資源管理の管理領域が割り付けられているデバイス名(ファイルの絶対パス名)を確認してください。

    この例では、媒体障害が発生したNFSのマウントポイントは、/userdb/netdbだと特定することができます。

    rdb: ERROR: qdg13039u:データベーススペースのデバイスに異常を
      検出しました DB名='INFOSTORAGEDB' DBS名='STDBSP001' デバイス名   
      ='/userdb/netdb/DBSP/DBS1' 物理ブロック番号='99' 原因コード
      ='1' 調査コード='2 0 ' 
    rdb: ERROR: qdg03650u:入出力障害のためデータベースをアクセス
      禁止状態にしました DB名='INFOSTORAGEDB' DSI名=' CATEGORYEXCLUSIVE_TDSI ' 
      ページ番号='10' DBS名='STDBSP001' 物理ブロ ック番号='99' 

    資源管理では、ディスク間欠障害の検査を行っています。ディスク間欠障害を検出した場合、CE保守情報をRDB構成パラメタファイルのRDBCOREで指定したディレクトリの以下のファイルに出力します。ディスク間欠障害が検出されたディスクを交換する場合は、これらのファイルの情報から障害ディスクを特定します。

    • pagedump_内部時間情報

    • pageinf_内部時間情報


  2. 資源管理の管理領域の切離し

    媒体障害からのリカバリを行うためにはディスクを交換します。交換作業を行う間、そのディスク上のすべての資源管理の管理領域に対するアクセスを抑止する必要があります。そのため、資源管理から一時的にすべての資源管理の管理領域を切り離します。切り離されたすべての資源管理の管理領域には、アクセス禁止状態が設定されます。資源管理の管理領域の切離しは、rdbexspcコマンドのmdetachオプションにより行います。

    rdbexspcコマンドの対象となる資源管理の管理領域名はセットアップ時の情報を参考にしてください。

    $ rdbexspc -mdetach -p INFOSTORAGEDB.STDBSP001 
    $ rdbexspc -mdetach -p INFOSTORAGEDB.STDBSP002 
    $ rdbexspc -mdetach -p INFOSTORAGEDB.STDBSP003 
    $ rdbexspc -mdetach -p INFOSTORAGEDB.STDBSP004

  3. 障害ディスクのリカバリ

    富士通CEによるディスクの交換を行ったあと、資源管理のリカバリ操作を行う前に、ディレクトリ構成のリカバリを行ってください。

    この例では、媒体障害が発生したディスクのディレクトリ構成のリカバリを行っています。

    $ mkdir /userdb/netdb/DBSP 

  4. 切り離した資源管理の管理領域の接続

    ディスク交換前に切り離した資源管理の管理領域を、資源管理に接続します。

    資源管理の管理領域の接続は、rdbexspcコマンドのmattachオプションにより行います。

    $ rdbexspc -mattach -p INFOSTORAGEDB.STDBSP001 
    $ rdbexspc -mattach -p INFOSTORAGEDB.STDBSP002 
    $ rdbexspc -mattach -p INFOSTORAGEDB.STDBSP003 
    $ rdbexspc -mattach -p INFOSTORAGEDB.STDBSP004

  5. アクセス禁止の設定

    リカバリを行うために、資源管理の管理領域をアクセス禁止状態にします。

    アクセス禁止状態にするには"2.5.3.2 バックアップ用リストファイルの作成"で作成したアクセス禁止リストファイルが必要です。

    以下の例では、アクセス禁止リストファイル"/home/rdb1/dsi_inh.list"を使用して、資源管理の管理領域にアクセス禁止を設定しています。

    $ rdbinh -f /home/rdb1/dsi_inh.list

  6. 管理領域のリカバリ

    資源管理の管理領域を、rdbrcvコマンドによりリカバリします。

    リカバリには”2.5.3資源管理のバックアップ”で作成したバックアップ用リストファイルと、バックアップ取得後に退避したすべてのアーカイブログが必要です。

    以下の例ではバックアップ用リストファイル”/home/rdb1/dsi.list”とバックアップ後に退避したアーカイブログ”/backup/arch001”を使用してリカバリしています。

    $ rdbrcv -F -t /home/rdb1/dsi.list -w /home/rdb1/work -a arch001@/backup

2.8.1.3 資源管理の管理領域をディスク管理製品のボリュームに割り付けている場合のリカバリ

資源管理の管理領域を、PRIMECLUSTER GDSやマルチパスディスクなどのディスク管理製品の提供するボリュームに割り付けている場合に、ボリュームを構成するすべてのディスクに障害が発生した場合のリカバリ操作は、以下の手順で行います。

なお、ここでの媒体障害とは、PRIMECLUSTER GDSミラーボリュームに割り当てたデータベースにまったくアクセスできない状態となり、システムメッセージ“qdg13039u”が出力される障害のことです。

参照

ミラーリングを構成する一部のディスクのみに障害が発生した場合の対処については、“PRIMECLUSTER Global Disk Services 説明書”を参照してリカバリしてください。

1. システムメッセージの確認および影響範囲の特定

2. 資源管理の管理領域の切離し

3. 障害ディスクのリカバリ

4. 切り離した資源管理の管理領域の接続

5. アクセス禁止の設定

6. 管理領域のリカバリ


  1. システムメッセージの確認および影響範囲の特定

    資源管理のアクセス中に媒体障害が発生した場合、資源管理は、以下のメッセージを出力します。このメッセージから、媒体障害が発生した資源管理の管理領域名および資源管理の管理領域が割り付けられているローデバイス名を確認してください。

    この例では、媒体障害が発生したローデバイスは、/dev/sfdsk/class0001/dsk/volume0001だと特定することができます。

    rdb: ERROR: qdg13039u:データベーススペースのデバイスに異常を
      検出しました DB名='INFOSTORAGEDB' DBS名='STDBSP001' デバイス名
      ='/dev/sfdsk/class0001/dsk/volume0001' 物理ブロック番号='99'
      原因コード='1' 調査コード='2 0 ' 
    rdb: ERROR: qdg03650u:入出力障害のためデータベースをアクセス
      禁止状態にしました DB名='INFOSTORAGEDB' DSI名='CATEGORYEXCLUSIVE_TDS '
      ページ番号='10' DBS名='STDBSP001' 物理ブロック番号='99' 

    メッセージに出力されたデバイス名から媒体障害が発生したディスクがPRIMECLUSTER GDSのボリュームであることがわかるので、PRIMECLUSTER GDS運用管理ビューから、PRIMECLUSTER GDSのボリューム名の属するミラーディスクグループに他のボリュームがないか確認します。

    参照

    PRIMECLUSTER GDS運用管理ビューの詳細については、“PRIMECLUSTER Global Disk Services 説明書”を参照してください。


  2. 資源管理の管理領域の切離し

    媒体障害からのリカバリを行うためにはディスクを交換します。交換作業を行う間、そのディスク上のすべての資源管理の管理領域に対するアクセスを抑止する必要があります。そのため、資源管理から一時的にすべての資源管理の管理領域を切り離します。切り離されたすべての資源管理の管理領域には、アクセス禁止状態が設定されます。資源管理の管理領域の切離しは、rdbexspcコマンドのmdetachオプションにより行います。

    rdbexspcコマンドの対象となる資源管理の管理領域名はセットアップ時の情報を参考にしてください。

    $ rdbexspc -mdetach -p INFOSTORAGEDB.STDBSP001 
    $ rdbexspc -mdetach -p INFOSTORAGEDB.STDBSP002 
    $ rdbexspc -mdetach -p INFOSTORAGEDB.STDBSP003 
    $ rdbexspc -mdetach -p INFOSTORAGEDB.STDBSP004

  3. 障害ディスクのリカバリ

    ディスク装置交換作業の前後にPRIMECLUSTER GDS運用管理ビューから、以下の処理を行います。

    • 物理ディスク交換

    • 物理ディスクリカバリ

    参照

    PRIMECLUSTER GDS運用管理ビューの詳細については、“PRIMECLUSTER Global Disk Services 説明書”を参照してください。


  4. 切り離した資源管理の管理領域の接続

    ディスク交換前に切り離した資源管理の管理領域を、資源管理に接続します。

    資源管理の管理領域の接続は、rdbexspcコマンドのmattachオプションにより行います。

    $ rdbexspc -mattach -p INFOSTORAGEDB.STDBSP001 
    $ rdbexspc -mattach -p INFOSTORAGEDB.STDBSP002 
    $ rdbexspc -mattach -p INFOSTORAGEDB.STDBSP003 
    $ rdbexspc -mattach -p INFOSTORAGEDB.STDBSP004

  5. アクセス禁止の設定

    リカバリを行うために、資源管理の管理領域をアクセス禁止状態にします。

    アクセス禁止状態にするには"2.5.3.2 バックアップ用リストファイルの作成"で作成したアクセス禁止リストファイルが必要です。

    以下の例では、アクセス禁止リストファイル"/home/rdb1/dsi_inh.list"を使用して、資源管理の管理領域にアクセス禁止を設定しています。

    $ rdbinh -f /home/rdb1/dsi_inh.list

  6. 管理領域のリカバリ

    資源管理の管理領域を、rdbrcvコマンドによりリカバリします。

    リカバリには”2.5.3資源管理のバックアップ”で作成したバックアップ用リストファイルと、バックアップ取得後に退避したすべてのアーカイブログが必要です。

    以下の例ではバックアップ用リストファイル”/home/rdb1/dsi.list”とバックアップ後に退避したアーカイブログ”/backup/arch001”を使用してリカバリしています。

    $ rdbrcv -F -t /home/rdb1/dsi.list -w /home/rdb1/work -a arch001@/backup