PCI Hot Plug ユーザーズガイド I/Oデバイス編
目次 前ページ次ページ

上へ第3章 ファイル関連デバイス
上へ3.1 交換手順

3.1.1 非冗長構成の場合

マルチパス制御を行うソフトウェアなどを使用せずに、非冗長構成でPCIカードを交換する場合は、そのPCIカードを使用しているユーザアプリケーションなどの上位製品(サービス)を停止する必要があります。

以下に、非冗長構成でのPCIカード交換手順を示します。

  1. マシン管理のハードウェア監視の停止

    マシン管理のハードウェア監視を停止するため、以下のコマンドを実行します。

    # /usr/sbin/FJSVmadm/prephp <Return>


  2. PCIカードの特定

    以下の手順により、交換対象のPCIカードとI/Oデバイスを接続するパスのインタフェース名と、その接続I/Oデバイスを特定します。

    1. コンソールに出力されたWARNINGメッセージ情報などから、交換対象となるPCIカードとI/Oデバイスを接続するパスのインタフェース名、およびその接続I/Oデバイスを特定します。
      以下の例では、glm2:故障したPCIカードとI/Oデバイスを接続するパスのインタフェース名、sd20:glm2に接続されたディスク装置と判断することができます。
      なお、2つのポートを内蔵するPCIカードを交換する場合には、もう片方のポートに対応するI/Oデバイスとの接続パスの物理パス名と、そのパスに接続されたI/Oデバイスを同様に特定する必要があります。
      もう片方のポートに対応する物理パス名は、同一PCIカードの2ポートの物理パス名が、"/pci@89,4000/scsi@2" と "/pci@89,4000/scsi@2,1" という関係になることから特定でき、その接続I/Oデバイスは特定した物理パス名のディレクトリ配下に存在すると判断できます。

              :
      WARNING: /pci@89,4000/scsi@2 (glm2):
            invalid intcode=fe00
              :
      WARNING: /pci@89,4000/scsi@2/sd@3,0 (sd20):
            SCSI transport failed: reason 'reset': giving up
              :


      以降は、上記コンソールメッセージが出力された場合を例に説明します。

    2. 故障したPCIカードに接続されたディスク装置(sd20)に対応する/dev/dsk配下の論理パス名を求めます。以下の例では、"c2t3d0"がsd20に対応する論理パス名となります。

      # ls -l /dev/dsk | grep /pci@89,4000/scsi@2/sd@3,0 <Return>

      lrwxrwxrwx    1  root    root        41  Sep 20  22:53  c2t3d0s0 
      -> ../../devices/pci@89,4000/scsi@2/sd@3,0:a
      lrwxrwxrwx    1  root    root        41  Sep 20  22:53  c2t3d0s1 
      -> ../../devices/pci@89,4000/scsi@2/sd@3,0:b
      lrwxrwxrwx    1  root    root        41  Sep 20  22:53  c2t3d0s2 
      -> ../../devices/pci@89,4000/scsi@2/sd@3,0:c
      lrwxrwxrwx    1  root    root        41  Sep 20  22:53  c2t3d0s3 
      -> ../../devices/pci@89,4000/scsi@2/sd@3,0:d
      lrwxrwxrwx    1  root    root        41  Sep 20  22:53  c2t3d0s4 
      -> ../../devices/pci@89,4000/scsi@2/sd@3,0:e
      lrwxrwxrwx    1  root    root        41  Sep 20  22:53  c2t3d0s5 
      -> ../../devices/pci@89,4000/scsi@2/sd@3,0:f
      lrwxrwxrwx    1  root    root        41  Sep 20  22:53  c2t3d0s6 
      -> ../../devices/pci@89,4000/scsi@2/sd@3,0:g
      lrwxrwxrwx    1  root    root        41  Sep 20  22:53  c2t3d0s7 
      -> ../../devices/pci@89,4000/scsi@2/sd@3,0:h



  3. 上位製品(サービス)の停止

    以下の操作により、上位製品(サービス)の使用を停止します。

    1. voldを停止します。

      # sh /etc/init.d/volmgt stop <Return>


    2. 2. の手順で求めた、故障したPCIカードに接続された全I/Oデバイスの使用を停止します。

      【ディスク装置(ファイルシステム運用)の場合】

      1) 2.b.の手順で求めた論理パス名(c2t3d0)をもとにして、対象ディスクのマウントポイントを求めます。

      # mount | grep c2t3d0 <Return>
      /export/home on /dev/dsk/c2t3d0s3 setuid/read/write/largefiles on Mon Sep 30 01:00:51 2002
      /develop/firm on /dev/dsk/c2t3d0s0 setuid/read/write/largefiles on Mon Sep 30 01:00:51 2002
      /develop/drv on /dev/dsk/c2t3d0s1 setuid/read/write/largefiles on Mon Sep 30 01:00:51 2002
      /pub on /dev/dsk/c2t3d0s6 setuid/read/write/largefiles on Mon Sep 30 01:00:50 2002


      2) 対象ディスクへのアクセスを停止させます。対象ファイルシステムの使用プロセスを調査するには、以下の例のようにfuser(1M)コマンドを使用します。

      # fuser -c /export/home <Return>
      /export/home:  14967c  14571c  14493ctm  14020c  13828tm  13803c  13575c  13133c  13125tm  13107c  12682ctm  12066tm  12048c  11971ctm  11952ctm  11937c  11867c  11846c   349m


      3) 対象ディスクをアンマウントします。

      # umount /export/home <Return>
      # umount /develop/firm <Return>
      # umount /develop/drv <Return>
      # umount /pub <Return>


      【ディスク装置(rawアクセス運用)/テープ装置の場合】

      1) 2.a.の手順で求めた対象ディスク(sd20)の現在までのアクセス状況を確認します。
      テープ装置の場合も同様です。

      # iostat -xc <Return>
      extended device statisticscpu
      devicer/sw/skr/skw/swaitactvsvc_t%w%bussywtid
      sd059.77.5474.545.00.03.958.6041372367
      sd10.10.31.02.50.00.016.000
      sd200.00.10.30.70.00.014.700
      st820.00.00.00.00.00.00.000


      2) 上位アプリケーションによる対象ディスクへのアクセスを停止させます。
      対象ディスクのアクセス状況は、以下の方法で確認できます。
      テープ装置の場合も同様で、以下の例では1分間のアクセス状況を参照しています。

      # sar -d 60 1 <Return>

      SunOS machine0 5.8 Generic_108528-05 sun4u 10/02/02

      17:56:00device%busyavquer+w/sblks/savwaitavserv
      17:57:00nfs100.0000.00.0
      sd020.32370.0145.5
      sd0,a10.1050.0301.4
      sd0,b00.0090.031.5
      sd0,c00.0000.00.0
      sd0,d10.0040.0126.8
      sd0,e00.0000.00.0
      sd0,f10.1160.0120.9
      sd0,g10.11140.0111.7
      sd2000.0000.00.0
      sd20,a00.0000.00.0
      sd20,c00.0000.00.0
      sd20,g00.0000.00.0
      st8200.0000.00.0


      3) 上位アプリケーションの停止(切離し)処理を行います。
      詳細については、各アプリケーション製品のマニュアルを参照してください。

      【ディスク装置(swapデバイス)の場合】

      1) swapデバイスの一覧を表示し、2.b.の手順で求めた論理パス名のディスク(c2t3d0)がswapデバイスであることを確認します。

      # swap -l <Return>
      swapfiledevswaploblocksfree
      /dev/dsk/c2t3d0s432,16416788384683680


      2) swapデバイスの削除を行います。

      # swap -d /dev/dsk/c2t3d0s4 <Return>



  4. PCIカードの切離し

    以下の手順により、交換するPCIカードを切り離します。

    1. 2.a.の手順で求めた、交換対象のPCIカードとI/Oデバイスを接続するパスのインタフェース名(glm2)をもとに、inst2comp(1M)コマンドを使用して、PCIカードのスロット位置を示す情報であるアタッチメントポイント識別子(attachment point identifier, 以降Ap_Idと略します)を求めます。
      Ap_Idおよびinst2comp(1M)コマンドの詳細は、"PCI Hot Plugユーザーズガイド"を参照してください。
      本例の場合、Ap_Idは"pcipsy3:C0M00-PCI#slot02"となります。

      # /usr/sbin/FJSVmadm/inst2comp glm2 <Return>
      pcipsy3:C0M00-PCI#slot02


    2. 4.a.で特定したAp_Idをパラメタに指定して、切離しを行うPCIカードのスロット状態が"connected configured"であることを確認します。

      # cfgadm pcipsy3:C0M00-PCI#slot02 <Return>
      Ap_IdTypeReceptacleOccupantCondition
      pcipsy3:C0M00-PCI#slot02mult/hpconnectedconfiguredok


    3. 4.a.のAp_Idを指定してPCIカードを切り離すコマンドを実行した後、スロット状態が"disconnected unconfigured"になったことを確認します。

      # cfgadm -c disconnect pcipsy3:C0M00-PCI#slot02 <Return>
      # cfgadm pcipsy3:C0M00-PCI#slot02 <Return>
      Ap_IdTypeReceptacleOccupantCondition
      pcipsy3:C0M00-PCI#slot02unknowndisconnectedunconfiguredunknown


    4. 交換作業時にスロット位置を確認しやすくするため、4.a.のAp_Idを指定してALARM LEDを点滅させます。

      # cfgadm -x led=fault,mode=blink pcipsy3:C0M00-PCI#slot02 <Return>


  5. PCIカードの交換

    4.の手順で切り離したPCIカードを交換部品と交換します。本作業は、当社技術員が行います。

    ファイバチャネルのPCIカードを交換する場合には、以下の作業も行う必要があります。

    【Systemwalker/StorageMGRのSAN管理機能、Softek SANView for ETERNUS(for Vixelは除く)、SP5000 SRM Facilityの何れかを使用している場合】
      6.の手順に移ります。
     
    【上記製品のSAN管理機能を使用していない場合】
      下記環境設定のPCIカードを交換する場合には、ファイバチャネルスイッチSN200 seriesや、ディスクアレイ装置ETERNUS3000/ETERNUS6000/GR700/800 seriesの設定変更を個別に行う必要があります。
    • SN200 seriesでWWPN(World Wide Port Name)によるゾーン設定を行っている場合
    • ETERNUS3000/ETERNUS6000/GR700/800 seriesのホストゾーニング(Host Afinity)機能を使用している場合
    詳細は、"SN200 seriesゾーニングユーザガイド" および "ETERNUSmgrユーザガイド/GRmgrユーザガイド" を参照してください。

    なお、上記設定変更の際には交換部品のWWPN(全16桁の数字)が必要となります。交換するカードのWWPNは、カード前面板にシールで貼られている8桁の数字から導き出します。
    この8桁の数字は、WWPNの下位8桁を16進数で表現しています。上位8桁の数字は、固定の16進数で10000000になります。
    例えば、前面板上に記載された8桁の数字(0e244061)が下記の場合に、交換するカードのWWPNは100000000e244061になります。

    0e24
    4061


    注意

    SN200 seriesにおいてゾーニング設定の変更を行った場合、実行中の他の装置へのI/Oがゾーニング変更の影響を受け、一時的なエラーが発生することがあります。
    ディスクアレイ装置などに対するI/Oは、リトライ処理により正常に復旧しますが、ファイバチャネルテープ装置では、バックアップ処理等がエラー終了することがあります。ゾーニングの変更処理は、バックアップを停止してから実施してください。


  6. PCIカードの組込み

    4.a.で求めたAp_Idに対してconfigure指定のcfgadm(1M)コマンドを実行するか、または、交換スロット位置のプッシュボタンを押すことによって、交換したPCIカードを組み込みます。
    なお、プッシュボタンはマルチユーザモードの場合のみ有効です。
    その後cfgadm(1M)コマンドによって、スロット状態が"connected configured"になったことを確認します。
    なお、交換スロットのPCIカードに大規模構成のI/Oデバイスが接続されている場合には、状態確認のコマンド実行に時間がかかることがあります。

    # cfgadm -c configure pcipsy3:C0M00-PCI#slot02 <Return>
    # cfgadm pcipsy3:C0M00-PCI#slot02 <Return>
    Ap_IdTypeReceptacleOccupantCondition
    pcipsy3:C0M00-PCI#slot02mult/hpconnectedconfiguredok


    また、ファイバチャネルのPCIカードを交換した場合には、以下の作業も行います。

    【Systemwalker/StorageMGRのSAN管理機能、Softek SANView for ETERNUS(for Vixelは除く)、SP5000 SRM Facilityの何れかを使用している場合】
     
    1. SAN(Storage Area Network)管理画面から『最新の状態に更新』を実行します。 この操作でSAN管理機能がPCIカードの交換を認識して表示するため、SAN管理画面からこのPCIカードを選択し、『アクセスパスの継承』を実行します。
      以上により、ファイバチャネルスイッチSN200 seriesのゾーニング情報や、ディスクアレイ装置ETERNUS3000/ETERNUS6000/GR700/800 seriesのホストゾーニング(Host Afinity)設定を、交換したPCIカードに合わせて変更します。
      詳細は、各製品の使用手引書もしくはユーザーズガイドを参照してください。

      注意

      SN200 seriesにおいてゾーニング設定の変更を行った場合、実行中の他の装置へのI/Oがゾーニング変更の影響を受け、一時的なエラーが発生することがあります。
      ディスクアレイ装置などに対するI/Oは、リトライ処理により正常に復旧しますが、ファイバチャネルテープ装置では、バックアップ処理等がエラー終了することがあります。ゾーニングの変更処理は、バックアップを停止してから実施してください。

    2. 交換したPCIカードをゾーニング情報が反映された状態で再組込みするため、以下のコマンドを実行します。

      # cfgadm -c disconnect pcipsy3:C0M00-PCI#slot02 <Return>
      # cfgadm -c configure pcipsy3:C0M00-PCI#slot02 <Return>
      # cfgadm pcipsy3:C0M00-PCI#slot02 <Return>
      Ap_IdTypeReceptacleOccupantCondition
      pcipsy3:C0M00-PCI#slot02mult/hpconnectedconfiguredok
     
    【上記製品のSAN管理機能を使用していない場合】
      作業はありません。

  7. 上位製品(サービス)の起動

    以下の操作により、停止していた上位製品(サービス)の使用を再開します。

    1. voldを起動します。

      # sh /etc/init.d/volmgt start <Return>


    2. 3.b.の手順で停止したデバイスの使用を再開します。

      【ディスク装置(ファイルシステム運用)の場合】

      • アンマウントしたファイルシステムをマウントし、使用を再開します。

        # mount /export/home <Return>
        # mount /develop/firm <Return>
        # mount /develop/drv <Return>
        # mount /pub <Return>



      【ディスク装置(rawアクセス運用)/テープ装置の場合】

      • 上位アプリケーションの再起動処理を行い、使用を再開します。
        詳細は、各アプリケーション製品のマニュアルを参照してください。

      【ディスク装置(swapデバイス)の場合】

      • swapデバイスの追加を行い、使用を再開します。

        # /sbin/swapadd -2 <Return>



  8. マシン管理のハードウェア構成情報更新/ハードウェア監視の起動

    マシン管理のハードウェア構成情報更新とハードウェア監視の再起動のため、以下のコマンドを実行します。

    # /usr/sbin/FJSVmadm/postphp <Return>


目次 前ページ次ページ

All Rights Reserved, Copyright(C) 富士通株式会社 2005