Dynamic Reconfigurationユーザーズガイド I/Oデバイス編
目次 前ページ次ページ

上へ第3章 ファイル関連デバイス
上へ3.1 交換手順

3.1.1 非冗長構成の場合

マルチパス制御を行う冗長化ソフトウェアなどを使用せずに、非冗長構成でPCIカードを交換する場合は、そのPCIカードを搭載したシステムボード上の全PCIカードとその接続デバイスについて、ユーザアプリケーションなどの上位製品(サービス)の使用を全て停止する必要があります。

以下に、非冗長構成でのPCIカード交換手順を示します。

  1. PCIカードとシステムボードの特定

    以下の手順により、故障したPCIカードを搭載したシステムボードと、そのシステムボードに接続された全てのデバイスを特定します。

    1. コンソールに出力されたWARNINGメッセージ情報から、故障したPCIカードとI/Oデバイスを接続するパスのインタフェースを特定します。
      下記例では、glm2:故障したPCIカードとI/Oデバイスを接続するパスのインタフェース、と判断できます。
      :
      WARNING: /pci@80,4000/scsi@2 (glm2):
      invalid intcode=fe00
      :
      WARNING: /pci@80,4000/scsi@2/sd@3,0 (sd20):
      SCSI transport failed: reason 'reset': giving up
      :

      以降も、上記コンソールメッセージが出力された場合を例に説明します。

    2. 1.a.で求めた、故障したPCIカードとI/Oデバイスを接続するパスのインタフェース(glm2)が接続されたシステムボード番号を特定し、そのシステムボード配下のデバイス一覧を求めます。
      システムボード番号は、下記赤字部分の行頭2桁の数字:XYXは筐体番号、Yは筐体内のシステムボード番号)になります。
      また、2番目のコマンドの実行結果から、該当システムボードには、ファイル関連デバイス(sd1,sd20)以外に、ネットワーク関連デバイスhme0("/pci@83,4000/network@1,1" 0 "hme")が接続されていると判断できます。
      以下の一覧に含まれるseドライバとscfドライバ(FJSVscfX)については、自動的に冗長構成になっているため、無視して構いません。
      seドライバおよびscfドライバの詳細については、"Enhanced Support Facilityユーザーズガイド"を参照してください。
      # /opt/FJSVhwr/sbin/drcstat -device | grep /pci@80,4000/scsi@2 <Return>
      00-PCI#0B "/pci@80,4000/scsi@2" 2 "glm"
      00-PCI#0B "/pci@80,4000/scsi@2,1" 3 "glm"
      00-PCI#0B "/pci@80,4000/scsi@2/sd@1,0" 1 "sd"
      00-PCI#0B "/pci@80,4000/scsi@2/sd@3,0" 20 "sd"
      # /opt/FJSVhwr/sbin/drcstat -device sb00 <Return>
      00-PCI#0B "/pci@80,4000/scsi@2" 2 "glm"
      00-PCI#0B "/pci@80,4000/scsi@2,1" 3 "glm"
      00-PCI#0B "/pci@80,4000/scsi@2/sd@1,0" 1 "sd"
      00-PCI#0B "/pci@80,4000/scsi@2/sd@3,0" 20 "sd"
      00-ONBOARD "/pci@83,4000/ebus@1/FJSV,scfc@14,200000" 0 "FJSVscf2"
      00-ONBOARD "/pci@83,4000/ebus@1/FJSV,se@14,400000" 0 "se"
      00-ONBOARD "/pci@83,4000/network@1,1" 0 "hme"

      以降では、sd20("/pci@80,4000/scsi@2/sd@3,0" 20 "sd")を例に切離し手順を説明します。

    3. sd20に対応する/dev/dsk配下の論理パス名を求めます。
      下記例では、"c2t3d0"がsd20に対応する論理パス名と判断できます。
      # ls -l /dev/dsk | grep /pci@80,4000/scsi@2/sd@3,0 <Return>
      lrwxrwxrwx 1 root root 41 Sep 20 22:53 c2t3d0s0
      -> ../../devices/pci@80,4000/scsi@2/sd@3,0:a
      lrwxrwxrwx 1 root root 41 Sep 20 22:53 c2t3d0s1
      -> ../../devices/pci@80,4000/scsi@2/sd@3,0:b
      lrwxrwxrwx 1 root root 41 Sep 20 22:53 c2t3d0s2
      -> ../../devices/pci@80,4000/scsi@2/sd@3,0:c
      lrwxrwxrwx 1 root root 41 Sep 20 22:53 c2t3d0s3
      -> ../../devices/pci@80,4000/scsi@2/sd@3,0:d
      lrwxrwxrwx 1 root root 41 Sep 20 22:53 c2t3d0s4
      -> ../../devices/pci@80,4000/scsi@2/sd@3,0:e
      lrwxrwxrwx 1 root root 41 Sep 20 22:53 c2t3d0s5
      -> ../../devices/pci@80,4000/scsi@2/sd@3,0:f
      lrwxrwxrwx 1 root root 41 Sep 20 22:53 c2t3d0s6
      -> ../../devices/pci@80,4000/scsi@2/sd@3,0:g
      lrwxrwxrwx 1 root root 41 Sep 20 22:53 c2t3d0s7
      -> ../../devices/pci@80,4000/scsi@2/sd@3,0:h

  2. 上位製品(サービス)の停止

    以下の操作により、故障したPCIカードを搭載したシステムボード上の全PCIカードの接続I/Oデバイスについて、上位製品(サービス)の使用を全て停止します。
    なお、1.b.のように、ネットワーク関連デバイスが接続されている場合には、ネットワーク関連デバイスも使用している可能性があるため、"第4章 ネットワーク関連デバイス"を参照して、上位製品の使用を停止させてください。

    1. voldを停止します。
      # sh /etc/init.d/volmgt stop <Return>

    2. 1.の手順で特定したI/Oデバイスの使用を停止します。

      【ディスク装置(ファイルシステム運用)の場合】

      1) 1.c.で求めた論理パス名(c2t3d0)をもとにして、対象ディスクのマウントポイントを求めます。
      # mount | grep c2t3d0 <Return>
      /export/home on /dev/dsk/c2t3d0s3 setuid/read/write/largefiles on Mon Sep 30 01:00:51 2002
      /develop/firm on /dev/dsk/c2t3d0s0 setuid/read/write/largefiles on Mon Sep 30 01:00:51 2002
      /develop/drv on /dev/dsk/c2t3d0s1 setuid/read/write/largefiles on Mon Sep 30 01:00:51 2002
      /pub on /dev/dsk/c2t3d0s6 setuid/read/write/largefiles on Mon Sep 30 01:00:50 2002

      2) 対象ディスクへのアクセスを停止させます。対象ファイルシステムの使用プロセスを調査するには、下記例のようにfuser(1M)コマンドを使用します。
      # fuser -c /export/home <Return>
      /export/home: 14967c 14571c 14493ctm 14020c 13828tm 13803c 13575c 13133c 13125tm 13107c 12682ctm 12066tm 12048c 11971ctm 11952ctm 11937c 11867c 11846c 349m

      3) 対象ディスクをアンマウントします。
      # umount /export/home <Return>
      # umount /develop/firm <Return>
      # umount /develop/drv <Return>
      # umount /pub <Return>

      【ディスク装置(rawアクセス運用)/テープ装置の場合】

      1) 1.b.で求めた対象ディスク(sd20)の現在までのアクセス状況を確認します。
      テープ装置の場合も同様です。
      # iostat -xc <Return>
      extended device statistics cpu
      device r/s w/s kr/s kw/s wait actv svc_t %w %b us sy wt id
      sd 59.7 7.5 474.5 45.0 0.0 3.9 58.6 0 41 3 7 23 67
      sd1 0.1 0.3 1.0 2.5 0.0 0.0 16.0 0 0
      sd20 0.0 0.1 0.3 0.7 0.0 0.0 14.7 0 0
      st82 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0 0
      nfs1 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0 0

      2) 上位アプリケーションによる対象ディスクへのアクセスを停止させます。
      対象ディスクのアクセス状況は、以下の方法で確認できます。
      テープ装置の場合も同様で、下記例では1分間のアクセス状況を参照しています。
      # sar -d 60 1 <Return>

      SunOS machine0 5.8 Generic_108528-05 sun4u 10/02/02

      17:56:00 device %busy avque r+w/s blks/s avwait avserv
      17:57:00 nfs1 0 0.0 0 0 0.0 0.0
      sd0 2 0.3 2 37 0.0 145.5
      sd0,a 1 0.1 0 5 0.0 301.4
      sd0,b 0 0.0 0 9 0.0 31.5
      sd0,c 0 0.0 0 0 0.0 0.0
      sd0,d 1 0.0 0 4 0.0 126.8
      sd0,e 0 0.0 0 0 0.0 0.0
      sd0,f 1 0.1 1 6 0.0 120.9
      sd0,g 1 0.1 1 14 0.0 111.7
      :
      sd20 0 0.0 0 0 0.0 0.0
      sd20,a 0 0.0 0 0 0.0 0.0
      sd20,c 0 0.0 0 0 0.0 0.0
      sd20,g 0 0.0 0 0 0.0 0.0
      :
      st82 0 0.0 0 0 0.0 0.0
      :

      3) 上位アプリケーションの停止(切離し)処理を行います。
      詳細は、各アプリケーション製品のマニュアルを参照してください。

      【ディスク装置(swapデバイス)の場合】

      1) swapデバイスの一覧を表示し、1.c.で求めた論理パス名のディスク(c2t3d0)がswapデバイスであることを確認します。
      # swap -l <Return>
      swapfile dev swaplo blocks free
      /dev/dsk/c2t3d0s4 32,164 16 788384 683680

      2) swapデバイスの削除を行います。
      # swap -d /dev/dsk/c2t3d0s4 <Return>

  3. システムボードの切離し

    drc(1M)コマンドにより、故障したPCIカードが搭載されたシステムボードを切り離し、システムボードの状態が"Unconfigured"になったことを確認します。
    上位製品の使用が完全に停止していない場合は、drc(1M)コマンドが異常終了するため、再度2.の手順に戻り、上位製品の停止処理を行ってください。

    # /opt/FJSVhwr/sbin/drc -disconnect sb00 -keep <Return>
    # /opt/FJSVhwr/sbin/drcstat -board sb00
    SB BN Status (Detail) PID Next_PID Board_Type CPU(MHz)
    -- -- --------------- --- -------- ---------- --------
    00 0 Unconfigured 00 00 10 300

  4. PCIカードの交換

    3.の手順で切り離したシステムボードを取りはずし、故障したPCIカードを交換部品と交換した後、システムボードを元の位置に実装します。本作業は、当社技術員が行います。

    ファイバチャネルのPCIカードを交換する場合には、以下の作業も行う必要があります。

    【Systemwalker/StorageMGRのSAN管理機能、Softek SANView for ETERNUS(for Vixelは除く)、SP5000 SRM Facilityの何れかを使用している場合】

    5.の手順に移ります。

    【上記製品のSAN管理機能を使用していない場合】

    下記環境設定のPCIカードを交換する場合には、ファイバチャネルスイッチSN200 seriesや、ディスクアレイ装置ETERNUS3000/ETERNUS6000/GR700/800 seriesの設定変更を個別に行う必要があります。

    詳細は、"SN200 seriesゾーニングユーザガイド" および "ETERNUSmgrユーザガイド/GRmgrユーザガイド" を参照してください。

    なお、上記設定変更の際には交換部品のWWPN(全16桁の数字)が必要となります。交換するカードのWWPNは、カード前面板にシールで張られている8桁の数字から導き出します。
    この8桁の数字は、WWPNの下位8桁を16進数で表現しています。上位8桁の数字は、固定の16進数で10000000になります。
    例えば、前面板上に記載された8桁の数字(0e244061)が下記の場合に、交換するカードのWWPNは100000000e244061になります。

    0e24
    4061

    注意

    SN200 seriesにおいてゾーニング設定の変更を行った場合、実行中の他の装置へのI/Oがゾーニング変更の影響を受け、一時的なエラーが発生することがあります。
    ディスクアレイ装置などに対するI/Oは、リトライ処理により正常に復旧しますが、ファイバチャネルテープ装置では、バックアップ処理等がエラー終了することがあります。ゾーニングの変更処理は、バックアップを停止してから実施してください。

  5. システムボードの組込み

    以下の操作により、切り離したシステムボードを組み込みます。

    1. drc(1M)コマンドにより、交換したPCIカードを搭載したシステムボードを組み込み、システムボードの状態が"Configured"になったことを確認します。
      # /opt/FJSVhwr/sbin/drc -connect sb00 <Return>
      # /opt/FJSVhwr/sbin/drcstat -board sb00
      SB BN Status (Detail) PID Next_PID Board_Type CPU(MHz)
      -- -- --------------- --- -------- ---------- --------
      00 0 Configured 00 00 10 300

    2. Systemwalker/StorageMGRのSAN管理機能、Softek SANView for ETERNUS(for Vixelは除く)、SP5000 SRM Facilityの何れかを使用している環境で、ファイバチャネルのPCIカードを交換した場合には、以下の作業を行います。
      他の環境の場合には、6.の手順に移ります。
      1) SAN(Storage Area Network)管理画面から『最新の状態に更新』を実行します。
      この操作でSAN管理機能がPCIカードの交換を認識して表示するため、SAN管理画面からこのPCIカードを選択し、『アクセスパスの継承』を実行します。
      以上により、ファイバチャネルスイッチSN200 seriesのゾーニング情報や、ディスクアレイ装置ETERNUS3000/ETERNUS6000/GR700/800 seriesのホストゾーニング(Host Affinity)設定を、交換したPCIカードに合わせて変更します。
      詳細は、各製品の使用手引書もしくはユーザーズガイドを参照してください。

      注意

      SN200 seriesにおいてゾーニング設定の変更を行った場合、実行中の他の装置へのI/Oがゾーニング変更の影響を受け、一時的なエラーが発生することがあります。
      ディスクアレイ装置などに対するI/Oは、リトライ処理により正常に復旧しますが、ファイバチャネルテープ装置では、バックアップ処理等がエラー終了することがあります。ゾーニングの変更処理は、バックアップを停止してから実施してください。

      2) 交換したPCIカードを搭載したシステムボードを、ゾーニング情報が反映された状態で再組込みするため、以下のコマンドを実行します。
      # /opt/FJSVhwr/sbin/drc -disconnect sb00 -keep <Return>
      # /opt/FJSVhwr/sbin/drc -connect sb00 <Return>
      # /opt/FJSVhwr/sbin/drcstat -board sb00
      SB BN Status (Detail) PID Next_PID Board_Type CPU(MHz)
      -- -- --------------- --- -------- ---------- --------
      00 0 Configured 00 00 10 300
  6. 上位製品(サービス)の起動

    以下の操作により、停止していた上位製品(サービス)の使用を再開します。
    2.の手順でネットワーク関連デバイスの停止も行った場合には、"第4章 ネットワーク関連デバイス"を参照して、上位製品の使用を再開させてください。

    1. voldを起動します。
      # sh /etc/init.d/volmgt start <Return>

    2. 2.b.の手順で停止したI/Oデバイスの使用を再開します。

      【ディスク装置(ファイルシステム運用)の場合】

      • アンマウントしたファイルシステムをマウントし、使用を再開します。
        # mount /export/home <Return>
        # mount /develop/firm
        <Return>
        # mount /develop/drv
        <Return>
        # mount /pub
        <Return>

      【ディスク装置(rawアクセス運用)/テープ装置の場合】

      • 上位アプリケーションの再起動処理を行い、使用を再開します。
        詳細は、各アプリケーション製品のマニュアルを参照してください。

      【ディスク装置(swapデバイス)の場合】

      • swapデバイスの追加を行い、使用を再開します。
        # /sbin/swapadd -2 <Return>


目次 前ページ次ページ

All Rights Reserved, Copyright(C) 富士通株式会社 2005