ここでは、ハードウェアの故障など、システムで問題が発生した場合に必要な作業について説明します。
基本的な操作手順
以下の手順で、RCコンソールから問題の確認と復旧作業を行います。
問題発生の確認
RCコンソールで、リソースに問題が発生したことを確認します。
確認方法については、以下を参照してください。
PRIMERGYシリーズの場合
「5.2 リソース状態」と「ServerView Resource Coordinator VE 導入ガイド」の「2.3 ステータス」を参照してください。
PRIMERGYシリーズ以外の場合
「ServerView Resource Coordinator VE 導入ガイド」の「2.3 ステータス」を参照してください。
イベントログの確認
イベントログから、異常が発生している装置とイベント内容を確認します。
1つの異常で複数のイベントが連続して発生する場合があるため、日時の近い過去のイベントを確認してください。
リソースの状態確認
リソースツリーで問題の発生しているリソースを展開して、影響の発生しているシャーシ、物理サーバ、LANスイッチ、物理OS、VMホスト、VMゲストを確認します。
物理OSまたはVMホストに対して自動リカバリを行う設定にしていた場合、自動的に予備サーバに切り替えて起動が行われます。自動リカバリを行う設定にしていなかった場合でも、予備サーバの設定を行っている場合は、手動でサーバの切替えができます。
サーバを切り替える方法については、「10.2 切替え」を参照してください。
詳細調査と復旧
異常の発生したリソースのリソース詳細から、管理ソフトウェアを操作して、詳細な原因を調査します。
管理ソフトウェアがない場合、異常の発生したリソースの保守担当者に確認して詳細な原因を調査してください。
そのあと、特定できた故障発生ハードウェアに対する保守作業を行ってください。
ハードウェアの故障で管理対象サーバの交換を行う場合は、「9.4 サーバの交換」を参照し、作業を行ってください。
復旧後の確認
復旧後、RCコンソールを確認し、異常を示す表示が消えているか確認してください。