Oracle VM Server for SPARC環境でライブマイグレーションを行う前の操作について説明します。
注意
本操作を実施する前に、“17.2.1 制御ドメイン上でクラスタのライブマイグレーション操作を行う場合”の事前設定を実施してください。
すべてのクラスタ対象の制御ドメイン上で、シャットダウン機構に登録されたXSCFのユーザ名とパスワードの組合せ、およびXSCFへの接続方法が、同一になっていることを確認してください。
移動先のサーバに対して以下の設定が行われていることを確認してください。
本操作を実施すると、“17.3.1.2 ライブマイグレーション後の操作”が完了するまで、クラスタシステムの切替えは行われません。
クラスタシステムの切替え中には、ライブマイグレーション操作を行わないでください。
クラスタの設定変更(制御ドメイン)
ライブマイグレーション前に、クラスタの設定を変更します。
移行元の制御ドメインのクラスタノードで、以下のコマンドを実行します。
# /etc/opt/FJSVcluster/bin/clovmmigrate -p source-ldom
移動対象のゲストドメイン名
本コマンドを実行すると、source-ldomに指定されたゲスト間クラスタの全ノードで、以下に示すクラスタ設定が変更されます。
CFのクラスタインタコネクトのタイムアウト値(現在の設定値(デフォルト10秒)→ 600秒)
シャットダウン機構の停止
注意
ライブマイグレーションを中止、または、失敗し、ゲストドメインが停止した場合、以下の復旧手順を実施してください。ゲストドメインが停止していない場合は、“17.3.1.2 ライブマイグレーション後の操作”を実行した後、再度“17.3.1.1 ライブマイグレーション前の操作”から実施してください。
マイグレーションしていないノードでcftool -nコマンドを実行し、移動対象のゲストドメインがDOWNになったことを確認してください。DOWN状態になるまで、clovmmigrateコマンドを実行後、およそ600秒かかります。
移動対象のゲストドメインを起動してください。
“17.3.1.2 ライブマイグレーション後の操作”を実行してください。
上記の復旧手順を実行せず、移動対象のゲストドメインがDOWN状態になる前に停止していたゲストドメインを起動した場合、移動対象のゲストドメインでSF、CRM、RMSの起動に失敗します。ゲストドメインを再度停止し、上記の復旧手順を実行してください。
Oracle VM Server for SPARC環境でライブマイグレーションを行った後の操作について説明します。
注意
本操作が完了するまで、クラスタシステムの切替えは行われません。
手順1.の操作は、制御ドメインで実行してください。
手順2.の操作は、ゲストドメインで実行してください。
本操作を行うには、保存されている論理ドメインの構成情報が6個以下である必要があります。以下のコマンドを実行し、保存されている論理ドメインの構成情報を確認してください。
また、保存されている論理ドメインの構成情報名に「config_tmp」がないことを確認してください。
# ldm list-spconfig
保存されている論理ドメインの構成情報が7個以上の場合は、以下のコマンドで、論理ドメインの構成情報を削除し、6個以下にしてください。
# ldm remove-spconfig 構成名
論理ドメインの構成情報名に「config_tmp」が存在する場合は、以下のコマンドで、論理ドメインの構成情報名「config_tmp」を削除してください。
# ldm remove-spconfig config_tmp
論理ドメインの構成情報の詳細については、“SPARC M12/M10 ドメイン構築ガイド”の“論理ドメイン構築に関する操作とコマンド”を参照してください。
クラスタの設定変更(制御ドメイン)
ライブマイグレーション後の、クラスタの設定を変更します。
移行元の制御ドメインのクラスタノードで、以下のコマンドを実行します。
# /etc/opt/FJSVcluster/bin/clovmmigrate -u source-ldom target-host
移動対象のゲストドメイン名
移動先の制御ドメインのIPアドレスまたは/etc/inet/hostsに登録されているホスト名
ライブマイグレーションを中止するなど、ゲストドメインの移動がない場合でも、制御ドメインの指定は必要です。その場合は、移動元の制御ドメインのIPアドレスまたは/etc/inet/hostsに登録されているホスト名を指定してください。
本コマンドを実行すると、source-ldomに指定されたゲスト間クラスタの全ノードで、以下に示すクラスタ設定が変更されます。また、移動元の制御ドメインと移動先の制御ドメインで論理ドメインの構成情報を保存します。
CFのクラスタインタコネクトのタイムアウト値(600秒→ライブマイグレーション前の設定値(デフォルト10秒))
シャットダウン機構の設定変更(XSCF-LAN#0のIPアドレス、XSCF-LAN#1のIPアドレス、SFの重み)
シャットダウン機構の起動
シャットダウン機構の状態確認(ゲストドメイン)
ゲストドメインの各ノードで以下のコマンドを実行し、ライブマイグレーション後のクラスタの設定が正しく行われたことを確認します。
# /etc/opt/FJSVcluster/bin/clsnmpsetup -l # /opt/SMAW/bin/sdtool -s
注意
TestFailedまたはInitFailedが表示された場合は、シャットダウン機構の設定が変更されなかった可能性があります。
/var/adm/messagesファイルに7245番のメッセージが出力されている場合は、XSCFへのSSH初回接続が完了していません。“PRIMECLUSTER 活用ガイド<メッセージ集>”を参照してください。
それ以外の場合は、再度、手順1.から実施してください。
例:2ノード構成のゲストドメイン間クラスタでguest2をマイグレーションした場合(“図17.1 クラスタ構成例”)
guest2 # /etc/opt/FJSVcluster/bin/clsnmpsetup -l device-name cluster-host-name PPAR-ID domain-name IP-address1 IP-address2 user-name connection-type ------------------------------------------------------------------------------------------------------------------- xscf cfguest1 0 guest1 10.20.30.71 10.20.40.71 xuser ssh xscf cfguest2 1 guest2 10.20.30.73 10.20.40.73 xuser ssh guest2 # ^^ ^^^^^^^^^^^^^^^^^^^^^^^^^^^ guest2 # ↑ ↑マイグレーション先のXSCFのIPアドレス guest2 # ↑マイグレーション先のPPAR-ID guest2 # /opt/SMAW/bin/sdtool -s Cluster Host Agent SA State Shut State Test State Init State ------------ ----- -------- ---------- ---------- ---------- cfguest1 SA_xscfsnmpg0p.so Idle Unknown TestWorked InitWorked cfguest1 SA_xscfsnmpg1p.so Idle Unknown TestWorked InitWorked cfguest1 SA_xscfsnmpg0r.so Idle Unknown TestWorked InitWorked cfguest1 SA_xscfsnmpg1r.so Idle Unknown TestWorked InitWorked cfguest2 SA_xscfsnmpg0p.so Idle Unknown TestWorked InitWorked cfguest2 SA_xscfsnmpg1p.so Idle Unknown TestWorked InitWorked cfguest2 SA_xscfsnmpg0r.so Idle Unknown TestWorked InitWorked cfguest2 SA_xscfsnmpg1r.so Idle Unknown TestWorked InitWorked guest2 #
注意
ライブマイグレーション後に、クラスタノード間で時刻が同期していないことを警告する以下のメッセージが、switchlogや/var/adm/messagesファイルに出力される場合があります。
(WRP, 34) Cluster host <host> is no longer in time sync with local node. Sane operation of RMS can no longer be guaranteed. Further out-of-sync messages will appear in the syslog.
また、時刻が同期していない状態が継続すると、以下のメッセージが定期的に/var/adm/messagesファイルに出力される場合があります。
(WRP, 35) Cluster host <host> is no longer in time sync with local node. Sane operation of RMS can no longer be guaranteed.
時刻が同期されれば、このメッセージは出力されなくなります。メッセージの詳細については、“PRIMECLUSTER 活用ガイド<メッセージ集>”を参照してください。