ここでは、ハードウェアの故障など、システムで問題が発生した場合に必要な作業について説明します。
基本的な操作手順
以下の手順で、RORコンソールから問題の確認と復旧作業を行います。
問題発生の確認
確認方法については、「11.2 リソース状態」と「操作ガイド インフラ管理者編 (リソース管理) CE」の「A.3 ステータス」を参照してください。
イベントログの確認
イベントログから、異常が発生している装置とイベント内容を確認します。
1つの異常で複数のイベントが連続して発生する場合があるため、日時の近い過去のイベントを確認してください。
リソースの状態確認
リソースツリーで問題の発生しているリソースを展開して、影響の発生しているシャーシ、物理サーバ、LANスイッチ、物理OS、VMホスト、VMゲストを確認します。
物理OSまたはVMホストに対して自動リカバリを行う設定にしていた場合、自動的に予備サーバに切り替えて起動が行われます。自動リカバリを行う設定にしていなかった場合でも、予備サーバの設定を行っている場合、手動でサーバの切替えができます。
サーバを切り替える方法については、「運用ガイド VE」の「4.2 切替え」を参照してください。
詳細調査と復旧
異常の発生したリソースのリソース詳細から、管理ソフトウェアを操作して、詳細な原因を調査します。
管理ソフトウェアがない場合、異常の発生したリソースの保守担当者に確認して詳細な原因を調査してください。
そのあと、特定できた故障発生ハードウェアに対する保守作業を行ってください。
ハードウェアの故障で管理対象サーバの交換を行う場合、「9.3.2 サーバの交換」を参照し、作業を行ってください。
復旧後の確認
復旧後、RORコンソールを確認し、異常を示す表示が消えているか確認してください。