本製品で管理しているハードウェア機器の保守方法について説明します。
ハードウェア保守の流れ
L-PLatformが動作するハードウェアの保守の流れを以下に示します。
図9.1 L-Platformが動作するハードウェア保守の流れ
保守作業の広報
ハードウェアの機器を管理するインフラ管理者は、定期保守やパッチ適用などの保守作業を実施するために、保守作業対象となったハードウェア上で動作するL-Platformを管理または利用しているテナント管理者およびテナント利用者に、保守作業の実施を通知します。
通知する手段の1つとして、本製品では、テナント管理者およびテナント利用者向けにRORコンソール上に"お知らせ"として情報を表示する機能を提供しています。
詳細は、「操作ガイド インフラ管理者編 CE」の「3.2 ホームのお知らせの編集」を参照してください。
管理対象サーバの停止
物理L-Serverの場合、テナント利用者は、管理対象サーバを停止します。
保守状態へ移行
インフラ管理者は、保守対象のリソースを保守モードに移行します。
保守対象が管理対象サーバの場合
物理L-Serverの場合
インフラ管理者が物理L-Serverを保守モードに設定します。
保守モードの詳細は、「操作ガイド インフラ管理者編 (リソース管理) CE」の「付録C 保守モード」を参照してください。
SPARC M10の場合
インフラ管理者が管理対象サーバを保守モードに設定します。
SPARC M10のCapacity on Demand(CoD)機能を使用して、システムに搭載されたCPUの容量を削減した場合も管理対象サーバを保守モードに設定します。
保守モードの詳細は、「操作ガイド インフラ管理者編 (リソース管理) CE」の「付録C 保守モード」を参照してください。
予備サーバが設定されていないサーバの場合
予備サーバが設定されていないサーバの場合、インフラ管理者は、管理対象サーバを保守モードに設定します。
保守モードの詳細は、「操作ガイド インフラ管理者編 (リソース管理) CE」の「付録C 保守モード」を参照してください。
保守対象がネットワークデバイスの場合
保守対象がネットワークデバイスの場合、インフラ管理者がネットワークデバイスを保守モードにすることで、監視や自動設定の対象から除外します。
詳細は、「操作ガイド インフラ管理者編 (リソース管理) CE」の「22.1 保守モードの切替え」を参照してください。
定期保守
インフラ管理者は、定期保守やパッチ適用などの保守作業を実施します。
管理対象サーバの保守は、以下を参照してください。
ネットワークデバイスの保守は、以下を参照してください。
保守状態の解除
インフラ管理者は、リソースの保守モードを解除します。
保守対象が管理対象サーバの場合
物理L-Serverの場合
インフラ管理者は、物理L-Serverの保守モードを解除します。
保守モードの詳細は、「操作ガイド インフラ管理者編 (リソース管理) CE」の「付録C 保守モード」を参照してください。
SPARC M10の場合
サーバ部品の交換、増設をした場合、リソースがマネージャーの監視対象のときはRORコンソールから情報が更新されたことを確認したあと、保守モードを解除してください。
CPUまたはメモリの変更を行った場合、以下を確認してください。
- [オーケストレーションツリー]の[リソース一覧]タブ
[VMホスト一覧]の[CPU容量(空容量/総容量)]と[メモリ容量(空容量/総容量)]
- [オーケストレーションツリー]の[リソース詳細]タブ
[VMホスト一覧]と、[容量情報]の[CPU容量]と[メモリ容量]
- [オーケストレーションツリー]の[利用可能プール]タブ
[VMプール]と[CPU容量(空容量/総容量)]と[メモリ容量(空容量/総容量)]
インフラ管理者は、管理対象サーバの保守モードを解除します。
保守モードの詳細は、「操作ガイド インフラ管理者編 (リソース管理) CE」の「付録C 保守モード」を参照してください。
予備サーバが設定されていないサーバの場合
予備サーバが設定されていないサーバの場合、インフラ管理者は、管理対象サーバの保守モードを解除します。
保守モードの詳細は、「操作ガイド インフラ管理者編 (リソース管理) CE」の「付録C 保守モード」を参照してください。
保守対象がネットワークデバイスの場合
インフラ管理者がネットワークデバイスを保守モードを解除することで、監視や自動設定の対象に組み込みます。
詳細は、「操作ガイド インフラ管理者編 (リソース管理) CE」の「22.1 保守モードの切替え」を参照してください。
保守作業完了の広報
インフラ管理者が、保守作業対象となったハードウェア上で動作するL-Platformを管理または利用しているテナント管理者およびテナント利用者に、保守作業の完了を通知します。
通知する手段の1つとして、本製品では、テナント管理者およびテナント利用者向けにRORコンソール上に"お知らせ"として情報を表示する機能を提供しています。
詳細は、「操作ガイド インフラ管理者編 CE」の「3.2 ホームのお知らせの編集」を参照してください。
ハードウェア故障時の対処の流れ
L-Platformが動作するハードウェア故障時の対処の流れは以下のとおりです。
図9.2 L-Platformが動作するハードウェア故障時の対処の流れ
異常検知
以下を契機に異常を検知します。
L-Platform上で動作する業務アプリケーションの利用者からテナント利用者に対して、動作異常などの連絡
インフラ管理者またはインフラ監視者によるハードウェア異常の検知
RORコンソール上で利用しているL-Platformのリソースの状態が"normal"以外に変化
調査依頼
テナント利用者は、検出した異常の情報(異常内容、異常発生のリソース名、L-Platform名)とともにテナント管理者に異常の原因について調査を依頼します。
テナント管理者は、テナント利用者から入手した情報とともにインフラ管理者に異常の原因について調査を依頼します。
状況確認
インフラ管理者は、入手した情報からリソースが割り当てられているハードウェアを特定し、状態を確認します。
原因調査
インフラ管理者は、問題が発生しているハードウェアの調査を行い、原因を究明します。
対処
インフラ管理者は、ハードウェアの異常を取り除くために対処します。
調査結果回答
インフラ管理者による対処完了後、インフラ管理者は、調査結果を回答します。
サーバ故障時のハードウェア保守の流れ
本製品に登録されているサーバに故障が発生した場合の、ハードウェア保守の流れを以下に示します。
図9.3 サーバ故障時のハードウェア保守の流れ
注1) 故障箇所の特定については、「11.3 リソース障害の対処」を参照してください。
注2) 保守モードの設定と解除については、「操作ガイド インフラ管理者編 (リソース管理) CE」の「付録C 保守モード」を参照してください。
注3) サーバの切替え、切戻しおよび継続については、「運用ガイド VE」の「第4章 サーバ切替え」を参照してください。
注4) システムイメージのバックアップ・リストアについては、「操作ガイド VE」の「第16章 バックアップ・リストア」を参照してください。
注5) メンテナンスLEDの操作については、「9.2.1 メンテナンスLED」を参照してください。なおメンテナンスLEDは、PRIMERGY BXシリーズのサーバだけ利用できます。
注6) ハードウェア情報の再設定については、「9.3.1 ハードウェア情報の再設定」を参照してください。
注7) 電源操作については、「操作ガイド VE」の「第14章 電源操作」を参照してください。
ハードウェア機器の交換は、以下の種類があります。
サーバの交換
本製品に登録されているサーバを交換します。
サーバの交換については、「9.3.2 サーバの交換」を参照してください。
サーバ部品の交換
本製品に登録されているサーバのNICやHBA、ハードディスクなどの部品を交換します。
サーバ部品の交換については、「9.3.3 サーバ部品の交換、増設」を参照してください。
サーバ以外のハードウェアの交換
本製品に登録されているシャーシや、マネジメントブレードなど、サーバ以外のハードウェアを交換します。
サーバ以外のハードウェアの交換については、「9.3.4 サーバ以外のハードウェアの交換」を参照してください。