ページの先頭行へ戻る
ETERNUS SF Storage Cruiser 14.0 ユーザーズガイド

8.1 障害発生時の画面と対処方法

ある装置で障害が発生するとリソース管理画面でイベントログ、装置イベントに障害内容が表示され、サポートレベル A および B の装置の障害が発生した装置アイコンが「異常(赤色)」または「警告(黄色)」に変更されます。赤色、黄色の色分けの基準は、装置それぞれの定義によります。また、本製品内で障害によって影響を受けるアクセスパスが特定できた場合は、そのアクセスパス状態を「アクセスパス異常(赤色)」に変更します。

サポートレベル I の装置では、初期状態ではイベントログや装置イベントに障害内容が表示されません。また、装置アイコンの色も変更されません。ただし、以下の条件をすべて満たす場合は、イベントログや装置イベントに障害内容を表示させたり、装置アイコンの色を変更させたりできます。

画面の状態に従って、以下の順番で対処します。
なお、サーバノードの HBA、マルチパス以外のミドルウェアの障害は、イベント報告だけです。ミドルウェアの障害の対処は、各ミドルウェアのマニュアルを参照してください。

  1. ストレージ、ライブラリ、ブリッジの状態が、「異常」または「警告」の場合

    GUI 画面で対象のストレージ、ライブラリ、ブリッジをダブルクリックして各ビューに移動します。さらに対象装置アイコンを右クリックし、ポップアップメニューの[管理ソフトウェア呼出し]を行います。これでストレージの保守画面が起動されるので、ここからストレージの故障対象部を特定します。故障部品の交換は、必要に応じて当社技術員(CE)にご連絡ください。

    なお、CA(チャネルアダプタ)が故障した場合は、最新の情報に更新すると「B.1 リソース管理画面の構成」の「ストレージビュー」で CA が「異常」と表示されます(ETERNUS、GR だけ)。ライブラリ装置内のロボットやテープが故障した場合も同様に最新の情報に更新すると、ロボットやテープが「異常」と表示されます(LT270、LT250、LT160だけ)。

  2. ファイバチャネルスイッチ、ハブの状態が「異常」または「警告」の場合

    GUI 画面でファイバチャネルスイッチまたはハブをダブルクリックしてファイバチャネルスイッチ/ハブビューに移動します。さらに、対象ファイバチャネルスイッチ/ハブアイコンを右クリックし、ポップアップメニューの[管理ソフトウェア呼出し]を行います。これで装置の保守画面が起動されるので、ここからファイバチャネルスイッチの故障対象部を特定します。故障部品の交換は、必要に応じて当社技術員(CE)にご連絡ください。

    なお、GBIC の故障などでポートが異常状態にある場合は、ファイバチャネルスイッチ/ハブビューでポートが「故障」と表示されます。この場合は、影響されるアクセスパスの状態が「アクセスパス異常」と表示されます。当該アクセスパスのプロパティを参照することで、影響する特殊ファイル名(デバイスファイル名)を認識できます。

    アクセスパスを本製品のアクセスパス設定で定義している場合は、ファイバチャネルスイッチのゾーニング設定は WWPN ゾーニングで定義されているため、ファイバチャネルスイッチポート故障時には他のファイバチャネルスイッチポートにファイバチャネルケーブルをつなぎ変えてそのまま運用が可能です。

    また、「4.2.1.3 対処(FAQ)」の「装置が警告表示(黄色表示)される場合」も参照してください。

  3. サーバノードの状態が「異常」または「警告」の場合

    B.1 リソース管理画面の構成」のサーバノードビューで「アクセスパス異常」のアクセスパスの物理経路を確認します。経路上に異常状態の装置が存在していない場合は、途中のファイバチャネルケーブルが切断されていないか確認してください。原因を特定できない場合は当社技術員にご連絡ください。

    なお、msdsm(Windows Server 2008 以降の Windows operating system に標準で組み込まれているマルチパスドライバ)を有効にしているサーバノードでは、シングルパス(冗長構成になっていないアクセスパス)が存在する場合も、サーバノードの状態が「警告」になります。これは、msdsm の仕様で「アクセスパス異常」に該当するアクセスパスの情報が OS 上から消えてしまい、シングルパスと区別できないためです。アクセスパスをシングルパスで構成する場合は、msdsm を無効にしてください。

    また、「4.2.1.3 対処(FAQ)」の「装置が警告表示(黄色表示)される場合」も参照してください。

  4. アクセスパスの状態が「アクセスパス異常」の場合の対処

    B.1 リソース管理画面の構成」のサーバノードビューで「アクセスパス異常」となっているアクセスパスのプロパティを参照し影響特殊ファイル名を特定します。Solaris OS の影響特殊ファイル名 /dev/rdsk/cXtYd?s? は、X:HBAプロパティのコントローラ番号、Y:アクセスパスのプロパティのターゲットIDから特定できます。

    [Solaris OS サーバノード] マルチパスディスク制御(ETMPD、MPLB、MPHD、GRMPD)で構成されているアクセスパスの場合は、マルチパスディスク制御のマニュアルを参照して、以下の対応をサーバノードで実施してください。なお、HBA を交換する場合は、HBA の交換手順を参照してください。

    マルチパスディスク制御の種類

    対応するマニュアル名

    ETMPD

    『ETERNUS マルチパスドライバ ユーザーズガイド』

    MPHD

    『マルチパスディスク制御説明書』

    MPLB

    『マルチパスディスク制御ロードバランスオプション(MPLB)説明書』

    GRMPD

    『GR マルチパスドライバユーザーズガイド』

    • パスの状態の確保(iompadm info)

      現在のパスの構成および状態を確認してください。マルチパスディスクアクセスがなかった場合は FAIL を検出していない場合もあります。

    • 障害発生アクセスパス関連の I/O 停止(iompadm change)

      ETMPD、MPLB、GRMPD では故障箇所によって影響を受ける I/O を自動的に停止させる機能を搭載しています。

    • 故障部品交換(故障部品交換が必要な場合)またはエラー対処

      故障部品の交換は、当社技術員(CE)までご連絡ください。

    • 停止されているアクセスパスの I/O 再起動(iompadm restart)

      マルチパスディスク制御(ETMPD、MPLB、MPHD、GRMPD)で構成されていないアクセスパスの場合は、対象の特殊ファイルをマウントしている業務に影響します。業務を停止し、故障の対処を行ってください。故障部品の交換は、当社技術員(CE)までご連絡ください。なお、HBA 交換をする場合は、次項の 5. および 6. HBA 交換手順を参照してください。

  5. [Solaris OS サーバノードの場合] HBA 交換手順

    活性交換機能をサポートしていないサーバノードでは、HBA の交換はサーバノードの電源を落として行います。なお、この交換手順中に再構成(reconfigure)モードでサーバノードの再起動/shutdown を行わないでください(reboot -r コマンドや boot -r コマンドなどを行うと、特殊ファイル名が変更されてしまいます)。また、活性交換機能をサポートしているサーバノードでは、HBA を交換し、「6.3.5 アクセスパスの継承」を実行するだけで、継続運用可能です。活性交換方法は、装置のマニュアルを参照してください。

    1. サーバノードシャットダウン

      /reconfigure ファイルが存在しないことを確認して装置を落とします。

      # ls /reconfigure
      /reconfigure: No such file or directory

      上記のようにファイルがないことを確認してください。/reconfigure ファイルがあった場合は、一度削除して、交換作業後にあらためて /reconfigure ファイルを作成し、サーバノードを再立ち上げします。

      /reconfigure ファイルの削除は、以下のコマンドを入力します。

      # rm /reconfigure

      削除した後に、/reconfigure ファイルの存在を ls コマンドで再確認してください。

      再構成(reconfigure)を行わずにシャットダウンします。

      # /usr/sbin/shutdown -y -i0 -g0
    2. HBAの交換

      故障部品の交換は、当社技術員(CE)までご連絡ください。

    3. サーバノードの立ち上げ

      サーバノードを立ち上げます。

      ただし、ここではアクセスパスは復旧しません。これは、ストレージおよびファイバチャネルスイッチに前のHBAの情報を基にしたゾーニングが定義されているためです。

    4. アクセスパスの継承(セキュリティの再設定)

      本製品で"アクセスパスの継承"を実行し、新しい HBA 情報を基に、前のアクセスパス同等にアクセスできるようなゾーニング設定をストレージおよびファイバチャネルスイッチに定義します。

    5. サーバノードの再立ち上げ

      再構成なし(reboot -r/boot -r などは禁止)で、サーバノードを再立ち上げしてください。

      # /usr/sbin/shutdown -i6

      ここではアクセスパスが復旧します。したがって、マルチパスディスク制御のパスも復旧されます。

  6. [Windows,Linux,HP-UX/その他のサーバノードの場合] HBA 交換手順

    活性交換機能をサポートしていないサーバノードでは、HBA の交換はサーバノードの電源を落として行います。なお、活性交換機能をサポートしているサーバノードでは、HBA を交換し、"アクセスパス継承"を実行するだけで、継続運用可能です。活性交換方法は、装置のマニュアルを参照してください。

    1. サーバノードシャットダウン

    2. HBA の交換

    3. サーバノードの立ち上げ

      ただし、ここではアクセスパスは復旧しません。これは、ストレージおよびファイバチャネルスイッチに前の HBA の情報を基にしたゾーニングが定義されているためです。

    4. アクセスパスの継承(セキュリティの再設定)

      本製品で"アクセスパスの継承"を実行し、新しい HBA 情報を基に、前のアクセスパス同等にアクセスできるようなゾーニング設定をストレージおよびファイバチャネルスイッチに定義します。

    5. サーバノードの再立ち上げ

  7. 部品交換後の本製品での対処

    メニューの[表示]-[最新の情報に更新]を選択して、現在の装置状態を確保してください。交換によって装置状態が復旧した場合は、装置の状態表示が正常状態に戻ります。

    ただし、LT120、LT130、LT200、LT210、LT220、LT230、NR1000、および手動組込みウィンドウで編集した装置状態は、自動的に復旧しません。装置の復旧完了後、装置の状態を手動で正常に戻してください。手動で装置状態を正常に戻すには、以下の2通りの方法があります。

    • リソース管理画面で装置のアイコンを右クリックし、ポップアップメニューから[プロパティ]を選択します。「装置状態」の[変更]ボタンを押し、表示される「装置状態変更」ダイアログのリストで "normal" を選択します。

    • 手動組込みウィンドウで装置アイコンを右クリックし、ポップアップメニューから[装置情報変更]を選択して、「装置状態」のリストで "normal" を選択します。

    ストレージ/ファイバチャネルスイッチの状態が正常状態に移行したが、サーバノードの状態が「異常」または「警告」の場合

    マルチパスディスク制御(ETMPD、GRMPD、MPLB、MPHD)のマニュアルに従って、故障パスを復旧してください。マルチパスディスク制御のパス復旧が終了後、再度[最新の情報に更新]を選択し、現在の装置の状態を確認してください。

    マルチパスディスク制御の種類

    対応するマニュアル名

    ETMPD

    『ETERNUS マルチパスドライバ ユーザーズガイド』

    MPHD

    『マルチパスディスク制御説明書』

    MPLB

    『マルチパスディスク制御ロードバランスオプション(MPLB)説明書』

    GRMPD

    『GR マルチパスドライバユーザーズガイド』