ページの先頭行へ戻る
PRIMECLUSTER 活用ガイド<メッセージ集>
FUJITSU Software

5.2.4 致命的エラー(CRITICAL)メッセージ

Advertisement server: Data received will be discarded due to receive error on socket. errno = errno

内容

シャットダウンデーモンが、ネットワーク通信によるデータ受信に失敗しました。このメッセージが出力された場合、ノード強制停止時に、意図しないノードが強制停止される可能性があります。

対処

このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

Agent Shutdown Agent uninitialization for host nodename failed

内容

シャットダウンエージェントが正常にアンインストールされていません。

対処

シャットダウンエージェントのログを確認し、当社技術員(SE)に連絡してください。

cannot determine the port on which the advertisement server should be started

内容

シャットダウンデーモンで使用するネットワーク通信用ポート番号の取得に失敗しました。

対処

以下のコマンドを実行します。

# /opt/SMAW/bin/sdtool -s

"The RCSD is not running" が表示された場合は、以下のコマンドを実行し、シャットダウン機構を起動してください。

# /opt/SMAW/bin/sdtool -b

以下のコマンドを実行し、その表示結果を確認してください。

# /opt/SMAW/bin/sdtool -s
  • 初期化状態が InitWorked、および、テスト状態が TestWorked の場合

    対処は不要です。

  • 初期化状態が InitFailed、または、テスト状態が TestFailed の場合

    (Solaris)
    /etc/inet/services ファイルに、以下の行が設定されているか確認してください。

    sfadv           2316/udp                        # SMAWsf package

    (Linux)
    /etc/services ファイルに以下の行が設定されているか確認してください。

    4.3A20以前

    sfadv           2316/udp                        # SMAWsf package

    4.3A30以降

    sfadv           9382/udp                        # SMAWsf package

    設定されていない場合は、この行を上記ファイルに設定してください。ファイルの修正後、以下を行ってください。

    • Solaris の場合

      以下のコマンドを実行し、シャットダウン機構を再起動してください。

      # /opt/SMAW/bin/sdtool -e
      # /opt/SMAW/bin/sdtool -b
    • Linux の場合

      ファイルを修正したクラスタノードを再起動してください。

  • 上記以外の状態の場合

    しばらく待ってから、再度コマンドを実行し、その表示結果を確認してください。

本対処法で対処できない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

Could not correctly read the rcsd.cfg file.

内容

rcsd.cfg ファイルが存在しないか、rcsd.cfg の構文が誤っています。

対処

rcsd.cfg ファイルを作成するか、構文を修正してください。

/etc/sysconfig/libvirt-guests is not configured on Hypervisor of host nodename. rcsd died abnormally.

内容

ノード <nodename> のハイパーバイザー上の /etc/sysconfig/libvirt-guests が設定されていません。シャットダウンデーモン (rcsd) を異常終了しました。

対処

以下の事象に応じて対処を行ってください。

事象1

ハイパーバイザーの停止または再起動により本メッセージが表示され、ノードの強制停止に失敗した場合

  1. 強制停止を実施したゲストOSがLEFTCLUSTER状態になっていることを確認してください。この時点では、LEFTCLUSTER状態は回復しないでください。

  2. 起動したゲストOSで、LEFTCLUSTER状態になるのを待ち合わせてください。

  3. 全ノードでLEFTCLUSTER状態になるのを確認した後、すべてのハイパーバイザーで /etc/sysconfig/libvirt-guests が正しく設定されているかを確認してください。/etc/sysconfig/libvirt-guests の設定については、"PRIMECLUSTER 導入運用手引書 (Linux)"を参照してください。

  4. クラスタアプリケーションを Online にしないゲストOS をすべて停止してください。

  5. ゲストOS がすべて停止したことを確認した後、クラスタアプリケーションを Online にするゲストOSで以下のコマンドを実行し、LEFTCLUSTER 状態を回復してください。

    # cftool -k
  6. クラスタアプリケーションを Online にするゲストOS で以下のコマンドを実行し、シャットダウン機構を起動してください。

    # /opt/SMAW/bin/sdtool -b

事象2

事象1以外の場合

  1. ノード <nodename> のハイパーバイザー上の /etc/sysconfig/libvirt-guests が正しく設定されているか確認してください。 /etc/sysconfig/libvirt-guests の設定については、"PRIMECLUSTER 導入運用手引書 (Linux)"を参照してください。

  2. 以下のコマンドを実行し、シャットダウン機構を起動してください。

    # /opt/SMAW/bin/sdtool -b

    この方法で対処できない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

Failed to create a signal handler for SIGCHLD
Failed to create a signal handler for SIGUSR1

内容

システム内部の問題です。

対処

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

Failed to get kernel parameter kernel.panic.

内容

カーネルパラメタ kernel.panicの取得に失敗しました。

対処

"sysctl -n kernel.panic" コマンドを実行した結果、値の取得に失敗しました。

このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

Failed to get kernel parameter kernel.sysrq.

内容

カーネルパラメタ kernel.sysrqの取得に失敗しました。

対処

"sysctl -n kernel.sysrq" コマンドを実行した結果、値の取得に失敗しました。

このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

Failed to get kernel parameter kernel.unknown_nmi_panic.

内容

カーネルパラメタ kernel.unknown_nmi_panicの取得に失敗しました。

対処

"sysctl -n kernel.unknown_nmi_panic" コマンドを実行した結果、値の取得に失敗しました。

このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

Failed to unlink/create/open CLI Pipe

内容

システム内部の問題です。

対処

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

Failed to open CFSF device, reason (value)string

内容

CFSF デバイスが開けません。

対処

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

Fail to post LEFTCLUSTER event:string

内容

rci がノードの障害を検出したときに LEFTCLUSTER イベントの送信に失敗しました。

対処

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

FATAL: rcsd died too frequently.It will not be started by rcsd_monitor.

内容

シャットダウンデーモン (rcsd) の異常終了後、再起動に失敗しました。

対処

当メッセージが出力される前に、シャットダウン機構のエラーメッセージが出力されてないか確認してください。エラーメッセージが出力されている場合は、その対処方法に従って対処を行ってください。

シャットダウン機構のエラーメッセージが出力されていない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

fopen of /etc/opt/SMAW/SMAWsf/rcsd.cfg failed, errno errno

内容

シャットダウン機構の設定が実施されておらず、シャットダウン機構の起動に失敗しています。

対処

シャットダウン機構の設定を見直した後、シャットダウンデーモンを起動し直してください。

Red Hat Enterprise Linux 5 (for Intel64) xenカーネル環境の場合は対処する必要はありません。

Forced to re open rcsd net pipe due to an invalid pipe name

内容

シャットダウンデーモンのネットワーク通信用のパイプに異常があったため、再作成しました。

対処

シャットダウン機構が、異常のあったネットワーク通信用のパイプを再作成しています。システムで動く他のプロセスへの影響はないので、対処不要です。

Forced to re-open rcsd net pipe due to a missing pipe name

内容

シャットダウンデーモンのネットワーク通信用のパイプに異常があったため、再作成しました。

対処

シャットダウン機構が、異常のあったネットワーク通信用のパイプを再作成しています。システムで動く他のプロセスへの影響はないので、対処不要です。

Forced to re-open rcsd net pipe due to failed stat pipe name errno: errno

内容

シャットダウンデーモンのネットワーク通信用のパイプに異常があったため、再作成しました。

対処

シャットダウン機構が、異常のあったネットワーク通信用のパイプを再作成しています。システムで動く他のプロセスへの影響はないので、対処不要です。

function of file failed, errno errno

内容

システム内部の問題です。

対処

このあとに関連するエラーメッセージがないかどうか確認してください。
関連メッセージがある場合は、それに基づいて対処を行ってください。

メッセージがない場合は、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

h_cfsf_get_leftcluster() failed. reason: (value)string

内容

cfsf_get_leftcluster の呼び出しに失敗しました。

対処

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

HostList empty

内容

rcsd.cfg の設定に誤りがあるか、または、rcsd.cfg の読み込みに失敗しました。

対処

以下のコマンドを実行します。

# /opt/SMAW/bin/sdtool -s

"The RCSD is not running" が表示された場合は、以下のコマンドを実行し、シャットダウン機構を起動してください。

# /opt/SMAW/bin/sdtool -b

以下のコマンドを実行し、その表示結果を確認してください。

# /opt/SMAW/bin/sdtool -s
  • 初期化状態が InitWorked、および、テスト状態が TestWorked の場合

    対処は不要です。

  • 初期化状態が InitFailed、または、テスト状態が TestFailed の場合

    rcsd.cfg の設定を確認し、設定に誤りがある場合は修正してください。修正後、以下のコマンドを実行し、シャットダウン機構を再起動してください。

    # /opt/SMAW/bin/sdtool -e
    # /opt/SMAW/bin/sdtool -b
  • 上記以外の状態の場合

    しばらく待ってから、再度コマンドを実行し、その表示結果を確認してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください

Host <nodename > ICF communication failure detected

内容

ノード <nodename > のハートビート停止がシャットダウン機構に通知されました。

対処

対処する必要はありません。

Host nodename MA_exec: string failed, errno errno

内容

ノード <nodename> 用の MA 実行スレッドの実行中にエラーが発生しました。

対処

調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

Illegal /etc/kdump.conf file. default option is not found.

内容

kdumpの構成定義ファイルにdefaultが存在しません。

対処

kdumpの構成定義ファイルにdefaultの設定を行ってください。

構成定義ファイルの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "kdumpの設定" を参照してください。

Illegal /etc/kdump.conf file. default option setting is incorrect.

内容

kdumpの構成定義ファイルのdefault設定に誤りがあります。

defaultに値が設定されていないか、poweroff以外の値が設定されています。

対処

kdumpの構成定義ファイルのdefaultに、poweroffを設定してください。

構成定義ファイルの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "kdumpの設定" を参照してください。

Illegal /etc/kdump.conf file. kdump_post option is not found.

内容

kdumpの構成定義ファイルにkdump_postが存在しません。

対処

kdumpの構成定義ファイルにkdump_postの設定を行ってください。

構成定義ファイルの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "kdumpの設定" を参照してください。

Illegal /etc/kdump.conf file. kdump_post option setting is incorrect.

内容

kdumpの構成定義ファイルのkdump_post設定に誤りがあります。

kdump_postに値が設定されていないか、poff.shスクリプトのフルパスが正しくありません。

対処

kdumpの構成定義ファイルのkdump_postに、以下の値を設定してください。

/opt/SMAW/SMAWsf/bin/poff.sh

構成定義ファイルの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "kdumpの設定" を参照してください。

Illegal /etc/opt/SMAW/SMAWsf/SA_vmawsReset.cfg file. CFName=nodename is not found.
Illegal /etc/opt/SMAW/SMAWsf/SA_vmawsAsyncReset.cfg file. CFName=
nodename is not found.

内容

AWS CLI(SA_vmawsReset、SA_vmawsAsyncReset)シャットダウンエージェントの構成定義ファイルの設定に誤りがあります。CFノード名 <nodename> が存在しません。

対処

AWS CLI(SA_vmawsReset、SA_vmawsAsyncReset)シャットダウンエージェントの構成定義ファイルに必要な項目を設定してください。

構成定義ファイルの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第4部 AWS 環境編" の "シャットダウン機構の設定" を参照してください。

Illegal /etc/opt/SMAW/SMAWsf/SA_vmawsReset.cfg file. itemname is not found.
Illegal /etc/opt/SMAW/SMAWsf/SA_vmawsAsyncReset.cfg file.
itemname is not found.

内容

AWS CLI(SA_vmawsReset、SA_vmawsAsyncReset)シャットダウンエージェントの構成定義ファイルの設定に誤りがあります。必要な項目名 <itemname> が存在しません。

対処

AWS CLI(SA_vmawsReset、SA_vmawsAsyncReset)シャットダウンエージェントの構成定義ファイルに必要な項目を設定してください。

構成定義ファイルの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第4部 AWS 環境編" の "シャットダウン機構の設定" を参照してください。

Illegal /etc/opt/SMAW/SMAWsf/SA_vmawsReset.cfg file. The invalid data is included.
Illegal /etc/opt/SMAW/SMAWsf/SA_vmawsAsyncReset.cfg file. The invalid data is included.

内容

AWS CLI(SA_vmawsReset、SA_vmawsAsyncReset)シャットダウンエージェントの構成定義ファイルに不要な情報が登録されています。

対処

AWS CLI(SA_vmawsReset、SA_vmawsAsyncReset)シャットダウンエージェントの構成定義ファイルから不要な情報を削除してください。

構成定義ファイルの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第4部 AWS 環境編" の "シャットダウン機構の設定" を参照してください。

Illegal /etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfg file. CFName=nodename is not found.

内容

Azure(SA_vmazureReset)シャットダウンエージェントの構成定義ファイルの設定に誤りがあります。CFノード名 <nodename> が存在しません。

対処

Azure(SA_vmazureReset)シャットダウンエージェントの構成定義ファイルに必要な項目を設定してください。

構成定義ファイルの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第5部 Azure 環境編" の "シャットダウン機構の設定" を参照してください。

Illegal /etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfg file. itemname is not found.

内容

Azure(SA_vmazureReset)シャットダウンエージェントの構成定義ファイルの設定に誤りがあります。必要な項目名 <itemname> が存在しません。

対処

Azure(SA_vmazureReset)シャットダウンエージェントの構成定義ファイルに必要な項目を設定してください。

構成定義ファイルの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第5部 Azure 環境編" の "シャットダウン機構の設定" を参照してください。

なお、itemname に InstanceID が表示された場合は、ResourceID に読み替えてください。

Illegal /etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfg file. The invalid data is included.

内容

Azure(SA_vmazureReset)シャットダウンエージェントの構成定義ファイルに不要な情報が登録されています。

対処

Azure(SA_vmazureReset)シャットダウンエージェントの構成定義ファイルから不要な情報を削除してください。

構成定義ファイルの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第5部 Azure 環境編" の "シャットダウン機構の設定" を参照してください。

Illegal /etc/opt/SMAW/SMAWsf/SA_vmosr.cfg file. CFName=nodename is not found.

内容

OpenStack API(SA_vmosr)シャットダウンエージェントの構成定義ファイルの設定に誤りがあります。CFノード名 <nodename> が存在しません。

対処

OpenStack API(SA_vmosr)シャットダウンエージェントの構成定義ファイルに cfname の項目がない場合は、cfname の項目を追加してください。cfname の項目がある場合は、cfname の項目に指定しているCFノード名に誤りがあるため、修正してください。

Illegal /etc/opt/SMAW/SMAWsf/SA_vmosr.cfg file. itemname is not found.

内容

OpenStack API(SA_vmosr)シャットダウンエージェントの構成定義ファイルの設定に誤りがあります。必要な項目名が存在しません。

対処

OpenStack API(SA_vmosr)シャットダウンエージェントの構成定義ファイルに必要な項目の設定を行ってください。

Illegal /opt/SMAW/SMAWRrms/etc/os_endpoint.cfg file. "itemname" is not found.

内容

RHOSP 環境情報ファイルの設定に誤りがあります。必要な項目名が存在しません。

対処

RHOSP 環境情報ファイルに必要な項目の設定を行ってください。

Illegal /opt/SMAW/SMAWRrms/etc/os_endpoint.cfg file. The invalid character string of "/vX.X" is included in "itemname".

内容

Identity サービスのエンドポイントの URL または Compute サービスのエンドポイントの URL に不要な文字列 "/vX.X" が含まれています。

対処

Identity サービスのエンドポイントの URL および Compute サービスのエンドポイントの URL には、"/vX.X" 以降の文字列は記載しないでください。

Illegal configfile file. item is not found

内容

メッセージが表示されたノードのコンフィグファイル configfile に、項目 item が存在しません。

対処

コンフィグファイル configfile に、item の情報を記載してください。

以下を参照し、コンフィグファイル configfile を修正してください。

  • configfile が/opt/SMAW/SMAWRrms/etc/k5_endpoint.cfg の場合

    "PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "FJcloud-O 環境情報ファイルの作成"

  • configfile が/etc/opt/SMAW/SMAWsf/SA_vmk5r.cfg の場合

    "PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第1部 FJcloud-O 環境編" の "シャットダウン機構の設定"

上記対処によってこのエラーを解決できない場合は、このメッセージを記録して、調査用の情報を採取します。

その後、当社技術員(SE)に連絡してください。

調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

Illegal kernel parameter. kernel.panic setting is incorrect.

内容

カーネルパラメタの設定に誤りがあります。kernel.panicが正しくありません。

対処

カーネルパラメタのkernel.panicに、0以外の値が設定されています。0を設定してください。

カーネルパラメタの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第4部 AWS 環境編" の "カーネルパラメタの確認/設定" を参照してください。

Illegal kernel parameter. kernel.sysrq setting is incorrect.

内容

カーネルパラメタの設定に誤りがあります。kernel.sysrqが正しくありません。

対処

カーネルパラメタのkernel.sysrqに、0が設定されています。0以外を設定してください。

カーネルパラメタの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第4部 AWS 環境編" の "カーネルパラメタの確認/設定" を参照してください。

Illegal kernel parameter. kernel.unknown_nmi_panic setting is incorrect.

内容

カーネルパラメタの設定に誤りがあります。kernel.unknown_nmi_panicが正しくありません。

対処

カーネルパラメタのkernel.unknown_nmi_panicに、1以外の値が設定されています。1を設定してください。

カーネルパラメタの項目に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第4部 AWS 環境編" の "カーネルパラメタの確認/設定" を参照してください。

Malloc failed during function

内容

メモリ不足が原因です。

対処

仮想メモリサイズ (ulimit -v) を増加するか、システムメモリを増加してください。問題が解決しない場合は、当社技術員(SE)に連絡してください。

Node id number ICF communication failure detected

内容

CF 層がハートビート停止を検出しました。

対処

rcsd が対処します。

rcsd died abnormally. Restart it.

内容

シャットダウンデーモン (rcsd) が異常終了後、再起動しました。

対処

シャットダウンデーモンは自動復旧するため対処は不要です。

SA_lkcd: FJSVossn is not installed.

内容

PRIMERGY添付ソフトウェアのOSステータス通知機能(FJSVossn)がインストールされていないため、kdumpシャットダウンエージェントが使用できません。

対処

OSステータス通知機能(FJSVossn)をインストールしてください。

SA SA_blade to test host nodename failed
SA SA_ipmi to test host nodename failed
SA SA_lkcd to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename の BMC(iRMC)、またはブレードサーバへの接続確認に失敗しました。

対処

以下の点を確認してください。

<共通>

  • システムまたはネットワークに負荷がかかっていないか。

    10分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s

<出力メッセージが SA_ipmi の場合>

  • /etc/opt/SMAW/SMAWsf/SA_ipmi.cfg に指定した iRMC/BMC の IP アドレス、および iRMC/BMC にログインするためのユーザ名およびパスワードなどが正しいか。

    /etc/opt/SMAW/SMAWsf/ SA_ipmi.cfg の指定については、"PRIMECLUSTER 導入運用手引書 (Linux)" を参照してください。

  • iRMC/BMC 側の設定が正しいか。

    iRMC/BMC の設定方法および確認方法については、各機種の “ユーザーズガイド”または“ServerView ユーザーズガイド” を参照してください。

  • iRMC/BMC の電源が投入されているか。

  • HUB と LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • iRMC/BMC 側コネクタ、または HUB 側コネクタから LAN ケーブルが抜けていないか。

  • iRMC/BMC の IP アドレスが、クラスタノードと同一セグメントになっているか。

  • iRMC/BMC 側でファームの再起動やファームアップなどの操作を行っていなかったか。

  • SA_ipmi.cfg に指定した iRMC/BMC にログインするためのユーザの LAN アクセス権限に、管理者 (Administrator) が設定されているか。

  • iRMC/BMC の IPMI(IPMI over LAN) が有効になっているか。

<出力メッセージが SA_blade の場合>

  • /etc/opt/SMAW/SMAWsf/SA_blade.cfg に指定した マネジメントブレードの IP アドレスやサーバブレードのスロット番号などが正しいか。

    /etc/opt/SMAW/SMAWsf/SA_ blade.cfg の指定については、"PRIMECLUSTER 導入運用手引書 (Linux)"を参照してください。

  • ブレードサーバ側の設定が正しいか。

    シャットダウン機構固有の設定留意点については、"PRIMECLUSTER 導入運用手引書 (Linux)"を参照してください。

    ブレードサーバの設定方法および確認方法については、"ServerViewユーザーズガイド"、装置添付の各種ハードウェアガイドを参照してください。

  • HUB と LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • マネジメントブレード側コネクタ、または HUB 側コネクタから LAN ケーブルが抜けていないか。

  • マネジメントブレード側でファームの再起動やファームアップなどの操作や、マスターモードのマネジメントブレードが切替わったなどの事象が発生していないか。

<出力メッセージが SA_lkcd の場合>

  • /etc/opt/SMAW/SMAWsf/rcsd.cfg の SA_lkcd の timeout 値の指定、および、/etc/opt/SMAW/SMAWsf/SA_lkcd.tout の指定が正しいか。

    これらのファイルの指定については、"PRIMECLUSTER 導入運用手引書 (Linux)" を参照してください。

    指定に誤りがある場合は修正してください。また、すべてのノードで確認および修正を行ってください。

  • シャットダウンエージェント設定時に、以下のコマンドを実行しているか。

    # /etc/opt/FJSVcllkcd/bin/panicinfo_setup

    Diskdump シャットダウンエージェント、または、Kdump シャットダウンエージェントを使用する場合、IPMIシャットダウンエージェント、または、Bladeシャットダウンエージェントの設定後に上記コマンドを実行する必要があります。IPMIシャットダウンエージェント、または、Bladeシャットダウンエージェントの設定を変更した場合も上記コマンドを、再度、実行する必要があります。

  • Diskdump シャットダウンエージェントを使用している場合は、Diskdump の設定が正しいか。Kdump シャットダウンエージェントを使用している場合は、kdump の設定が正しいか。

    Diskdump または kdump の設定方法および確認方法は、"PRIMECLUSTER 導入運用手引書 (Linux)" を参照してください。

  • IPMI シャットダウンエージェントを使用している場合は、前述の <出力メッセージが SA_ipmi の場合> の確認を行ってください。Blade シャットダウンエージェントを使用している場合は、前述の <出力メッセージが SA_blade の場合> の確認を行ってください。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や BMC(iRMC)、ブレードサーバ、あるいは HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_icmp to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename への接続確認に失敗しました。

対処

以下の点を確認してください。

  • 管理 OS側でパニックやハングアップなどの事象が発生していなかったか。

  • ゲストOS、管理 OS、またはネットワークに負荷がかかっていないか。

    10分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s

  • ノードnodename が停止していないか。

  • /etc/opt/SMAW/SMAWsf/SA_icmp.cfg に指定した IP アドレス、およびネットワークインタフェースなどが正しいか。

    /etc/opt/SMAW/SMAWsf/SA_icmp.cfg の指定については、"PRIMECLUSTER 導入運用手引書 (Linux)" を参照してください。

  • ゲスト OS に割り当てた仮想 IP アドレス、およびネットワークインタフェースが正しいか。

  • HUB と LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • ケーブルが正しく接続されているか。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_ilomp.so to test host nodename failed
SA SA_ilomr.so to test host nodename failed
SA SA_rccu.so to test host nodename failed
SA SA_xscfp.so to test host nodename failed
SA SA_xscfr.so to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename の XSCF、RCCU、または、ILOM への接続確認に失敗しました。

対処

以下の点を確認してください。

<共通>

  • システムまたはネットワークに負荷がかかっていないか。

    • Solaris PRIMECLUSTER 4.2A00以前の場合

      以下のコマンドを実行し、コンソール非同期監視機能およびシャットダウン機構を再起動してください。

      # /opt/SMAW/bin/sdtool -e
      # /etc/opt/FJSVcluster/bin/clrccumonctl stop
      # /etc/opt/FJSVcluster/bin/clrccumonctl start
      # /opt/SMAW/bin/sdtool -b
    • Solaris PRIMECLUSTER 4.3A10以降の場合

      10分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

      # /opt/SMAW/bin/sdtool -s

<コンソールにRCCUを使用している場合>

  • RCCU の IP アドレスやノード名などのコンソール情報が正しいか。

    clrccusetup(1M) を使用して設定されているコンソール情報を確認してください。コンソール情報に誤りがある場合は、clrccusetup(1M) を使用して、コンソール情報を再登録してください。

  • RCCU 側の設定が正しいか。

    RCCU の設定方法、および確認方法は、RCCU に添付の取扱説明書を参照してください。

  • RCCU の電源が投入されているか。

  • HUB と LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • RCCU 側コネクタ、またはHUB 側コネクタから LAN ケーブルが抜けていないか。

  • RCCU の IP アドレスが、管理 LAN と同一セグメントになっているか。

<コンソールにXSCFを使用している場合>

  • XSCF の IP アドレスやノード名、接続方法(telnet、SSH)などのコンソール情報が正しいか。

    clrccusetup(1M) を使用して、設定されているコンソール情報を確認してください。コンソール情報に誤りがある場合は、clrccusetup(1M) を使用して、コンソール情報を再登録してください。

  • XSCF 側の設定が正しいか。

    シャットダウン機構固有の設定留意点は、"PRIMECLUSTER 導入運用手引書 (Oracle Solaris)"を参照してください。
    XSCF の設定方法、および確認方法は、"XSCF (eXtended System Control Facility) ユーザーズガイド" を参照してください。

  • XSCF への接続方法に SSH を使用している場合

    • シャットダウン機構用のログインユーザアカウントを使用してクラスタノードから XSCF へ SSH 接続し、SSH 初回接続時のユーザ問い合わせ(RSA 鍵の生成など)が完了しているか。

    • クラスタノードから XSCF へ SSH 接続する際のユーザ認証方法としてパスワード認証を使用しているか。

      公開鍵認証などパスワード認証を自動化する認証方法を XSCF で使用している場合は、無効化してください。XSCF の設定方法、および確認方法については、"XSCF (eXtended System Control Facility) ユーザーズガイド" を参照してください。

  • HUB および LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • XSCF の XSCF-LAN ポートのコネクタ、またはHUB 側コネクタから LAN ケーブルが抜けていないか。

  • XSCF の telnet ポートのうち、XSCF シェルポートにクラスタ外から接続されていないか。

    シリアルポート(tty-a)経由で XSCF シェルに接続して確認してください。接続方法および確認方法は、"XSCF (eXtendedSystem Control Facility) ユーザーズガイド" を参照してください。

  • XSCF の IP アドレスが、管理 LAN と同一セグメントになっているか。

  • XSCF側で、ファームの再起動やファームアップなどの操作や、XSCFのフェイルオーバなどの事象が発生していなかったか。

<コンソールにILOMを使用している場合>

  • ILOM の IP アドレスやノード名などのコンソール情報が正しいか。

    clrccusetup(1M) を使用して設定されているコンソール情報を確認してください。コンソール情報に誤りがある場合は、clrccusetup(1M) を使用して、コンソール情報を再登録してください。

  • ILOM 側の設定が正しいか。

    シャットダウン機構固有の設定留意点については、"PRIMECLUSTER 導入運用手引書 (Oracle Solaris)" を参照してください。
    ILOM の設定方法、および確認方法は、以下を参照してください。

    • ILOM 2.x の場合

      "Integrated Lights Out Manager ユーザーズガイド"

    • ILOM 3.0 の場合

      "Integrated Lights Out Manager (ILOM) 3.0 概念ガイド"

      "Integrated Lights Out Manager (ILOM) 3.0 Web Interface 手順ガイド"

      "Integrated Lights Out Manager (ILOM) 3.0 CLI 手順ガイド"

      "Integrated Lights Out Manager (ILOM) 3.0 入門ガイド"

  • シャットダウン機構用のログインユーザアカウントを使用して、クラスタノードから ILOM へ SSH 接続し、SSH 初回接続時のユーザ問い合わせ(RSA 鍵の生成など)が完了しているか。

  • ILOM 3.0 の場合、クラスタノードから ILOM へ SSH 接続する際のユーザ認証方法として、パスワード認証を使用しているか。

    公開鍵認証・ホストキーベース認証などパスワード認証を自動化する認証方法を ILOM で使用している場合は、無効化してください。ILOM の設定方法および確認方法については、前述の ILOM 3.0 の各種ガイドを参照してください。

  • HUB および LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • ILOM のネットワーク管理(NET MGT)ポートのコネクタ、またはHUB 側コネクタからLAN ケーブルが抜けていないか。

  • ILOM側で、ファームの再起動やファームアップなどの操作を行っていなかったか。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、コンソール非同期監視機能およびシャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /etc/opt/FJSVcluster/bin/clrccumonctl stop
# /etc/opt/FJSVcluster/bin/clrccumonctl start
# /opt/SMAW/bin/sdtool -b

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や RCCU、XSCF、ILOM、あるいは HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_irmcf.so to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename の MMB への接続確認に失敗しました。

対処

直前に下記のメッセージが出力されているか確認してください。メッセージが出力されている場合、"4.5 エラー(ERROR)メッセージ" を参照し、対処を実施してください。

  • 7210 An error was detected in MMB.

  • 7214 The username or password to login to the MMB is incorrect.

  • 7606 The snmptrapd is not running.

  • 7609 The IPMI service is not running.

  • 7610 The authority of user to login to MMB is incorrect.

メッセージが出力されていない場合、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。

調査情報の採取方法については、"PRIMECLUSTER活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_irmcp.so to test host nodename failed
SA SA_irmcr.so to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename の iRMC への接続確認に失敗しました。

対処

直前に下記のメッセージが出力されているか確認してください。メッセージが出力されている場合、"4.5 エラー(ERROR)メッセージ" を参照し、対処を実施してください。

  • 7602 The user name or password to login to iRMC is incorrect.

  • 7603 The authority of user to login to iRMC is incorrect.

  • 7604 An error has been detected in the transmission route to iRMC.

  • 7605 An error has been detected in iRMC.

  • 7606 The snmptrapd is not running.

  • 7609 The IPMI service is not running.

メッセージが出力されていない場合、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。

調査情報の採取方法については、"PRIMECLUSTER活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_kzchkhost to test host nodename failed

内容

メッセージが表示されたノードから、ノードnodename の ILOM、または XSCF への接続確認に失敗しました。

対処

以下の点を確認してください。

<共通>

  • システムまたはネットワークに負荷がかかっていないか。

    10分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • HUB および LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

<ILOM (SPARC T4T5、T7S7) の場合>

  • ILOM の IP アドレスやノード名などのグローバルゾーンホスト情報が正しいか。

    シャットダウン構成ウィザードを使用して、設定されているグローバルゾーンホスト情報を確認してください。

    グローバルゾーンホスト情報に誤りがある場合は、シャットダウン構成ウィザードを使用して、グローバルゾーンホスト情報を再登録してください。

  • ILOM 側の設定が正しいか。

    シャットダウン機構固有の設定留意点については、"PRIMECLUSTER 導入運用手引書 (Oracle Solaris)" を参照してください。

    ILOM の設定方法、および確認方法は、以下を参照してください。

    "Integrated Lights Out Manager (ILOM) 3.0 概念ガイド"

    "Integrated Lights Out Manager (ILOM) 3.0 Web Interface 手順ガイド"

    "Integrated Lights Out Manager (ILOM) 3.0 CLI 手順ガイド"

    "Integrated Lights Out Manager (ILOM) 3.0 入門ガイド"

  • シャットダウン機構用のログインユーザアカウントを使用して、カーネルゾーンから ILOM へ SSH 接続し、SSH 初回接続時のユーザ問い合わせ(RSA 鍵の生成など)が完了しているか。

  • カーネルゾーンから ILOM へ SSH 接続する際のユーザ認証方法として、パスワード認証を使用しているか。

    公開鍵認証・ホストキーベース認証などパスワード認証を自動化する認証方法を ILOM で使用している場合は、無効化してください。ILOM の設定方法および確認方法については、前述の ILOM 3.0 の各種ガイドを参照してください。

  • ILOM のネットワーク管理 (NET MGT) ポートのコネクタ、または HUB 側コネクタから LAN ケーブルが抜けていないか。

  • ILOM側で、ファームの再起動やファームアップなどの操作を行っていなかったか。

<XSCF (SPARC M10M12) の場合>

  • 論理ドメインの構成情報を保存したか。

  • XSCF 側で論理ドメインの状態が確認できるか。

    上記項目が原因だと判明した場合、ldm add-spconfigコマンドを使用して論理ドメインの構成情報を保存してください。

  • システムまたはネットワークに負荷がかかっていないか。

  • XSCF の IP アドレスやノード名、接続方法 (telnet、SSH) などのグローバルゾーンホスト情報が正しいか。

    シャットダウン構成ウィザードを使用して、設定されているグローバルゾーンホスト情報を確認してください。

    グローバルゾーンホスト情報に誤りがある場合は、シャットダウン構成ウィザードを使用して、グローバルゾーンホスト情報を再登録してください。

  • XSCF 側の設定が正しいか。

    シャットダウン機構固有の設定留意点は、"PRIMECLUSTER 導入運用手引書 (Oracle Solaris)" を参照してください。

    XSCF の設定方法、および確認方法は、"SPARC M12/M10 システム運用・管理ガイド"を参照してください。

  • XSCF への接続方法に SSH を使用している場合

    • シャットダウン機構用のログインユーザアカウントを使用してカーネルゾーンから XSCF へ SSH 接続し、SSH 初回接続時のユーザ問い合わせ(RSA 鍵の生成など)が完了しているか。

    • カーネルゾーンから XSCF へ SSH 接続する際のユーザ認証方法としてパスワード認証を使用しているか。

      公開鍵認証などパスワード認証を自動化する認証方法を XSCF で使用している場合は、無効化してください。

      XSCF の設定方法、および確認方法については、"SPARC M12/M10 システム運用・管理ガイド" を参照してください。

  • XSCF の XSCF-LAN ポートのコネクタ、または HUB 側コネクタから LAN ケーブルが抜けていないか。

  • XSCF シェルにクラスタ外から接続されていないか。

    シリアルポート経由で XSCF シェルに接続して確認してください。接続方法および確認方法は、"SPARC M12/M10 システム運用・管理ガイド" を参照してください。

  • XSCF の IP アドレスが、管理 LAN や非同期監視サブ LAN と同一セグメントになっているか。

  • XSCF側で、ファームの再起動やファームアップなどの操作や、XSCFのフェイルオーバなどの事象が発生していなかったか。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や ILOM、XSCF、HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_kzonep to test host nodename failed
SA SA_kzoner to test host nodename failed

内容

メッセージが表示されたノードから、ノードnodename の カーネルゾーンへの接続確認に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

    10分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • HUB と LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • 管理 LAN ポートのコネクタ、または HUB 側コネクタから LAN ケーブルが抜けていないか。

  • ゾーン名やグローバルゾーンホスト名などのカーネルゾーンの情報が正しいか。

    シャットダウン構成ウィザードを使用して、設定されているカーネルゾーン情報を確認してください。

    カーネルゾーン情報に誤りがある場合は、シャットダウン構成ウィザードを使用して、カーネルゾーン情報を再登録してください。

  • シャットダウン機構用のログインユーザアカウントを使用して、カーネルゾーンから グローバルゾーンホストへ SSH 接続し、SSH 初回接続時のユーザ問い合わせ(RSA 鍵の生成など)が完了しているか。

  • XSCF 側の設定が正しいか。

    シャットダウン機構固有の設定留意点は、"PRIMECLUSTER 導入運用手引書 (Oracle Solaris)"を参照してください。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。

調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_libvirtgp to test host nodename failed
SA SA_libvirtgr to test host nodename failed

内容

メッセージが表示されたノードから、ノードnodename のハイパーバイザーへの接続確認に失敗しました。

対処

以下の点を確認してください。

  • ゲストOS、ハイパーバイザー、またはネットワークに負荷がかかっていないか。

    10分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • 以下の指定が正しいか。

    • /etc/opt/SMAW/SMAWsf/SA_libvirtgp.cfg

    • /etc/opt/SMAW/SMAWsf/SA_libvirtgr.cfg

    シャットダウン機構用のユーザのパスワードについては、/opt/SMAW/bin/sfcipher コマンドで暗号化したものを指定する必要があります。

    これらのファイルの指定については、"PRIMECLUSTER 導入運用手引書 (Linux)" を参照してください。

  • ハイパーバイザーへの接続にパスフレーズが設定されていないか。

  • ゲスト OS に割り当てた仮想 IP アドレスが正しいか。

  • ハイパーバイザー側、またはゲスト OS 側の設定が正しいか。

    ハイパーバイザー側、またはゲスト OS 側の設定については、"PRIMECLUSTER 導入運用手引書 (Linux)"を参照してください。

  • シャットダウン機構用のログインユーザアカウントにsudoコマンドの設定が行われているか。

    sudoコマンドの設定については、"PRIMECLUSTER 導入運用手引書 (Linux)"を参照してください。

  • シャットダウン機構用のログインユーザアカウントを使用して、ゲスト OS(ノード)からハイパーバイザーへ SSH 接続し、SSH 初回接続時のユーザ問い合わせ(RSA 鍵の生成など)が完了しているか。

  • ゲスト OS(ノード)からハイパーバイザーへ SSH 接続する際のユーザ認証方法として、パスワード認証を使用しているか。

    公開鍵認証などパスワード認証を自動化する認証方法をハイパーバイザーで使用している場合は、無効化してください。

  • HUB と LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • ケーブルが正しく接続されているか。

  • ハイパーバイザー側でパニックやハングアップなどの事象が発生していなかったか。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。

調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_mmbp.so to test host nodename failed
SA SA_mmbr.so to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename の MMB への接続確認に失敗しました。

対処

本メッセージが OS 起動直後にのみ出力され、メッセージ出力の 10 分後に、下記 3083 のメッセージが出力されている場合は、snmptrapd デーモンが起動中のため表示されるもので、対処不要です。

3083: Monitoring another node has been started.

上記に該当しない場合は、以下の設定を確認してください。

  • MMB の IP アドレス、または、MMB シャットダウン機構のシャットダウンデーモンに設定した、自ノードにおける管理 LAN の IP アドレスに、正しい IP アドレスが指定されているか。

  • MMB シャットダウン機構のMMB情報に登録されている、RMCP で MMB を制御するためのユーザのユーザ名・パスワードが正しいか。

  • MMB シャットダウン機構に設定した、RMCP で MMB を制御するためのユーザの[Privilege]が「Admin」になっているか。

  • MMB シャットダウン機構に設定した、RMCP で MMB を制御するためのユーザの[Status]が「Enabled」になっているか。

MMB シャットダウン機構に設定した、RMCP で MMB を制御するためのユーザの設定を確認する方法については、本体装置添付のマニュアルを参照してください。

MMB の IP アドレスが変更されている場合や、設定に誤りがあり、MMB シャットダウン機構の MMB 情報の変更が必要な場合は、"PRIMECLUSTER 導入運用手引書 (Linux)" の運用構成変更の記事に従って対処してください。このとき、MMB の IP アドレスが変更されている場合は、その操作手順内の MMB の IP アドレス変更操作は不要です。

他の設定に誤りがある場合は修正し、すべてのノードで以下のコマンドを実行して、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

設定に誤りがない場合は、以下を確認してください。

  • snmptrapd デーモンが起動しているか(ps(1) コマンド等により snmptrapd のプロセスの存在を確認)。

  • HUB と LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • MMB ポートのコネクタ、または HUB 側コネクタから LAN ケーブルが抜けていないか。

  • MMB 側でファームの再起動やファームアップなどの操作、Active MMB の切替わりなどの事象が発生していないか。

  • MMB が故障していないか。

  • ノードやネットワークに負荷がかかっていないか。

上記が原因と判明した場合、対処を行った後、MMB 非同期監視は自動復旧します。

自動復旧には最大で 10 分かかります。

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や、MMB または HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で対処できない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。

調査情報の採取方法については、"PRIMECLUSTER活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_pprcip.so to test host nodename failed
SA SA_pprcir.so to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename の RCI への接続確認に失敗しました。

対処

以下の点を確認してください。

  • システムに負荷がかかっていないか。

    • Solaris PRIMECLUSTER 4.2A00以前の場合

      以下のコマンドを実行し、RCI非同期監視機能およびシャットダウン機構を再起動してください。

      # /opt/SMAW/bin/sdtool -e
      # /etc/opt/FJSVcluster/bin/clrcimonctl stop
      # /etc/opt/FJSVcluster/bin/clrcimonctl start
      # /opt/SMAW/bin/sdtool -b
    • Solaris PRIMECLUSTER 4.3A10以降の場合

      10分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

      # /opt/SMAW/bin/sdtool -s
  • RCI が正しく設定されているか。RCI アドレスにおいて以下の異常はないか。

    • RCI アドレスは設定されているか。

    • RCI アドレスが重複していないか。

    • RCI 非同期監視が動作している状態で他ノードの RCI アドレスを変更してないか。

  • ケーブルが正しく接続されているか。

  • SCF/RCI 経由での監視タイムアウト時間が、/etc/system ファイルに正しく設定されているか。監視タイムアウト時間の設定方法については、"PRIMECLUSTER 導入運用手引書 (Oracle Solaris)"を参照してください。

  • RCI 装置側で、ファームの再起動やファームアップなどの操作を行っていなかったか。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、RCI 非同期監視機能およびシャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /etc/opt/FJSVcluster/bin/clrcimonctl stop
# /etc/opt/FJSVcluster/bin/clrcimonctl start
# /opt/SMAW/bin/sdtool -b

上記項目を確認しても接続に失敗する場合は、RCI ケーブル、システム監視機構(以降、System Control Facility: SCF と略す)などのハードウェア故障と考えられます。このメッセージを記録して、SCF ダンプおよび調査情報を採取し、当社技術員(SE, CE)に連絡してください。SCF ダンプおよび調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_rpdu to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename の筐体へ接続されているリモート電源制御ユニットへの接続確認に失敗しました。

対処

以下の点を確認してください。

<対処1>
  • リモート電源制御ユニットに異常が発生していないか

    以下のマニュアルを参照し、異常の確認を実施してください。

    “富士通 SPARC M10 システム用 リモート電源制御ユニット 取扱説明書”の“障害切り分け ”

上記項目が原因だと判明した場合、マニュアルに従い、対処を実施してください。

<対処2>
  • システム、またはネットワークに負荷がかかっていないか。

    10 分後に本メッセージが表示されていない場合、復旧していることがあります。

    以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • RPDU シャットダウンエージェントの設定に指定したリモート電源制御ユニットの IP アドレス、コンセント番号、ユーザ名およびパスワードなどが正しいか。

    RPDU シャットダウンエージェントの設定内容を確認してください

    詳細は "PRIMECLUSTER 導入運用手引書 (Oracle Solaris)" を参照してください。

  • ノードに接続されているコンセントが Off になっていないか。

    以下のコマンドを実行し、リモート電源制御ユニットの状態を確認してください。

    # /opt/SMAW/SMAWsf/bin/sfrpdupoweron -l

    Off と表示されるコンセントが存在した場合、以下のコマンドを実施し On 状態へ切り替えてください。

    # /opt/SMAW/SMAWsf/bin/sfrpdupoweron -p CFノード名
  • HUB および LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • リモート電源制御ユニットの LAN ポートのコネクタ、または HUB 側コネクタから LAN ケーブルが抜けていないか。

  • リモート電源制御ユニット側でファームの再起動やファームアップなどの操作を行っていなかったか。

  • リモート電源制御ユニットへ接続するユーザに必要な権限が付与されているかどうか。

    RPDU シャットダウンエージェントの設定に指定したユーザに、必要な権限が付与されていない可能性があります。詳細は “PRIMECLUSTER 導入運用手引書 (Oracle Solaris)”を参照してください。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。

調査情報の採取方法については、“PRIMECLUSTER 活用ガイド<トラブルシューティング編>”を参照してください。

SA SA_sunF to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename の ALOM への接続確認に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

    10分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • /etc/opt/SMAW/SMAWsf/SA_sunF.cfg に指定した ALOM の IP アドレスや ALOM にログインするためのユーザ名およびパスワードなどが正しいか。

    /etc/opt/SMAW/SMAWsf/SA_sunF.cfg の指定については、"PRIMECLUSTER 導入運用手引書 (Oracle Solaris)" を参照してください。

  • ALOM 側の設定が正しいか。

    シャットダウン機構固有の設定留意点については、"PRIMECLUSTER 導入運用手引書 (Oracle Solaris)" を参照してください。
    ALOM の設定方法、確認方法については、"Advanced Lights Out Management (ALOM) CMT ガイド" を参照してください。

  • HUB と LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • ALOM のネットワーク管理(NET MGT)ポートのコネクタ、または HUB 側コネクタからLAN ケーブルが抜けていないか。

  • ALOM 側でファームの再起動やファームアップなどの操作を行っていなかったか。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や ALOM、あるいは HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_vmawsReset to test host nodename failed
SA SA_vmawsAsyncReset to test host
nodename failed

内容

メッセージが表示されたノードから、ノード nodename への接続確認に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

    10 分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • 構成定義ファイル(/etc/opt/SMAW/SMAWsf/SA_vmawsReset.cfg、または/etc/opt/SMAW/SMAWsf/SA_vmawsAsyncReset.cfg)の指定が正しいか。

    構成定義ファイルの設定に関しては、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第4部 AWS 環境編" の "シャットダウン機構の設定" を参照してください。

  • AWS Command Line Interface(以降、AWS CLI)の設定が正しいか。

    aws configure コマンドで設定した、IAM ユーザの認証情報が正しいか確認してください。

  • AWS CLI は、バージョン1(1.16以降)がインストールされているか。

  • AWS CLI が、/usr/local/aws、/usr/local/bin ではなく、root ユーザ向け(/root/.local/bin)にインストールされているか。

  • クラスタホストが動作しているインスタンスから、AWS のエンドポイントに通信が行える状態になっているか。

上記項目が原因だと判明した場合、対処を行ったうえで、メッセージが出力されたノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_vmazureReset to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename への接続確認に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

    10 分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • 構成定義ファイル (/etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfg) の指定が正しいか。

    • nodename には、PRIMECLUSTER がインストールされている環境の情報を設定する必要があります。

    • nodename の設定に関しては、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第5部 Azure 環境編" の "シャットダウン機構の設定" を参照してください。

  • クラスタホストが動作している仮想マシンから Azure のエンドポイントに通信が行える状態になっているか。

  • Azure CLI がインストールされており、サービスプリンシパルが登録されているか。

  • サービスプリンシパルの証明書ファイルを配置したファイルパスをAzure (SA_vmazureReset) シャットダウンエージェントの構成定義ファイルのCertPathに指定しているか。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_vmchkhost to test host nodename failed
SA SA_vmgp to test host nodename failed
SA SA_vmSPgp to test host nodename failed
SA SA_vmSPgr to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename の 管理 OS への接続確認に失敗しました。

対処

以下の点を確認してください。

  • 管理 OS 側でパニックやハングアップなどの事象が発生していなかったか。

  • ゲストOS、管理 OS、またはネットワークに負荷がかかっていないか。

    10分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s

  • 出力メッセージが SA_vmchkhost 、SA_vmSPgp、またはSA_vmSPgr の場合、以下の指定が正しいか。

    • /etc/opt/SMAW/SMAWsf/SA_vmchkhost.cfg

    • /etc/opt/SMAW/SMAWsf/SA_vmSPgp.cfg

    • /etc/opt/SMAW/SMAWsf/SA_vmSPgr.cfg

    管理 OS のアカウント FJSVvmSP のログインパスワードについては、/opt/SMAW/bin/sfcipher コマンドで暗号化したものを指定する必要があります。
    これらのファイルの指定については、"PRIMECLUSTER 導入運用手引書 (Linux)" を参照してください。

  • 出力メッセージが SA_vmgp の場合、管理 OS の IP アドレス、ユーザ名、またはノード名など、管理 OS 情報が正しいか。

    clvmgsetup(1M) を使用して、設定されている管理 OS 情報を確認してください。管理 OS 情報に誤りがある場合は、clvmgsetup(1M) を使用して、管理 OS 情報を修正してください。

  • 管理 OS への接続にパスフレーズが設定されていないか。

  • ゲスト OS に割り当てた仮想 IP アドレスが正しいか。

  • 管理 OS 側、またはゲスト OS 側 の設定が正しいか。

    管理 OS 側、またはゲスト OS 側の設定については、"PRIMECLUSTER 導入運用手引書 (Linux)"を参照してください。

  • シャットダウン機構用のログインユーザアカウントを使用して、ゲスト OS(ノード)から管理 OS へ SSH 接続し、SSH 初回接続時のユーザ問い合わせ(RSA 鍵の生成など)が完了しているか。

  • ゲスト OS(ノード)から管理 OS へ SSH 接続する際のユーザ認証方法として、パスワード認証を使用しているか。公開鍵認証などパスワード認証を自動化する認証方法を管理 OS で使用している場合は、無効化してください。

  • HUB と LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • PRIMEQUEST 側コネクタから LAN ケーブルが抜けていないか。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_vmk5r to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename への接続確認に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

    10 分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • /opt/SMAW/SMAWRrms/etc/k5_endpoint.cfg に指定した、FJcloud-O の環境情報が正しいか。

    /opt/SMAW/SMAWRrms/etc/k5_endpoint.cfg の指定については、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "FJcloud-O 環境情報ファイルの作成" を参照してください。

  • /etc/opt/SMAW/SMAWsf/SA_vmk5r.cfg に指定した、仮想サーバ名、および、仮想サーバの強制停止用のユーザ名、パスワードなどが正しいか。

    /etc/opt/SMAW/SMAWsf/SA_vmk5r.cfg の指定については、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第1部 FJcloud-O 環境編" の "シャットダウン機構の設定" を参照してください。

  • /etc/opt/SMAW/SMAWsf/SA_vmk5r.cfg に指定した、仮想サーバの強制停止用のユーザのパスワードの有効期限(90日)が切れていないか。

    "PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "定期的なパスワード変更" を参照して、パスワードを変更してください。また、定期的にパスワードを変更してください。

  • クラスタホストが動作している仮想サーバから、FJcloud-O のリージョナル利用者管理、コンピュート(スタンダードサービス)のエンドポイントと通信が行える状態になっているか。

上記対処によってこのエラーを解決できない場合は、このメッセージを記録して、調査用の情報を採取します。

その後、当社技術員(SE)に連絡してください。

調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_vmosr to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename への接続確認に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

    10 分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • 以下の指定が正しいか。

    • /opt/SMAW/SMAWRrms/etc/os_endpoint.cfg

    • /etc/opt/SMAW/SMAWsf/SA_vmosr.cfg

    RHOSP のインスタンス制御用のユーザのパスワードについては、/opt/SMAW/bin/sfcipher コマンドで暗号化したものを指定する必要があります。

    これらのファイルの指定については、"PRIMECLUSTER 導入運用手引書 (Linux)" を参照してください。

  • RHOSP のインスタンス制御用のユーザに admin ロールが付与されているか。

  • クラスタホストが動作しているインスタンスから、RHOSP の Identity サービスと Compute サービスに通信が行える状態になっているか。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_vwvmr to test host nodename failed

内容

メッセージが表示されたノードから、vCenter Server への接続確認に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

    10 分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • /etc/opt/SMAW/SMAWsf/SA_vwvmr.cfg に指定した vCenter Server の IP アドレス、ポート番号、ユーザ名およびパスワードなどが正しいか。

  • /etc/opt/SMAW/SMAWsf/SA_vwvmr.cfg に指定した VM 名が正しいか。

  • /etc/opt/SMAW/SMAWsf/SA_vwvmr.cfg に日本語が含まれる場合、SA_vwvmr.cfg の文字コードが UTF-8 となっているか。

    /etc/opt/SMAW/SMAWsf/SA_vwvmr.cfg の指定については、"PRIMECLUSTER 導入運用手引書 (Linux)" を参照してください。

  • /etc/opt/SMAW/SMAWsf/SA_vwvmr.cfg に指定したユーザーに、VM の電源断に必要な権限、ロールが設定されているか。

    ユーザーの権限については、"PRIMECLUSTER 導入運用手引書 (Linux)" を参照してください。

  • ゲスト OS に割り当てたネットワークインタフェースが正しいか。

  • HUB と LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • ケーブルが正しく接続されているか。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA SA_xscfsnmpg0p.so to test host nodename failed
SA SA_xscfsnmpg1p.so to test host
nodename failed
SA SA_xscfsnmpg0r.so to test host
nodename failed
SA SA_xscfsnmpg1r.so to test host
nodename failed
SA SA_xscfsnmp0r.so to test host
nodename failed
SA SA_xscfsnmp1r.so to test host
nodename failed

内容

メッセージが表示されたノードから、ノード nodename の XSCF への接続確認に失敗しました。

対処

以下を確認してください。

<対処1>
  • マイグレーション後のクラスタへの操作が行われているか。

  • コールドマイグレーションで停止していたゲストドメインが起動されているか。

上記項目が原因だと判明した場合、“PRIMECLUSTER 導入運用手引書 (Oracle Solaris)”を参照してマイグレーション後の操作を行ってください。

<対処2>
  • 論理ドメインの構成情報を保存したか。

  • XSCF側で論理ドメインの状態が確認できるか。

上記項目が原因だと判明した場合、ldm add-spconfigコマンドを使用して論理ドメインの構成情報を保存してください。

<対処3>
  • システムまたはネットワークに負荷がかかっていないか。

  • XSCF の IP アドレスやノード名、接続方法(telnet、SSH)などのコンソール情報が正しいか。

  • clsnmpsetup(1M)を使用して、設定されているSNMP非同期監視情報を確認してください。SNMP非同期監視情報に誤りがある場合は、clsnmpsetup(1M)を使用して、SNMP非同期監視情報を再登録してください。

  • XSCF 側の設定が正しいか。

  • シャットダウン機構固有の設定留意点は、“PRIMECLUSTER 導入運用手引書 (Oracle Solaris)”を参照してください。

  • XSCF の設定方法、および確認方法は、“SPARC M12/M10 システム運用・管理ガイド”を参照してください。

  • XSCF への接続方法に SSH を使用している場合

    • シャットダウン機構用のログインユーザアカウントを使用してクラスタノードから XSCF へ SSH 接続し、SSH 初回接続時のユーザ問い合わせ(RSA 鍵の生成など)が完了しているか。

    • クラスタノードから XSCF へ SSH 接続する際のユーザ認証方法としてパスワード認証を使用しているか。

    • 公開鍵認証などパスワード認証を自動化する認証方法を XSCF で使用している場合は、無効化してください。XSCF の設定方法、および確認方法については、“SPARC M12/M10 システム運用・管理ガイド”を参照してください。

  • HUB および LAN ケーブルが接続されているポートの正常ランプが点灯しているか。

  • XSCF の XSCF-LAN ポートのコネクタ、またはHUB 側コネクタから LAN ケーブルが抜けていないか。

  • XSCF シェルにクラスタ外から接続されていないか。

  • シリアルポート経由で XSCF シェルに接続して確認してください。接続方法および確認方法は、“SPARC M12/M10 システム運用・管理ガイド”を参照してください。

  • XSCF の IP アドレスが、管理 LAN や非同期監視サブLANと同一セグメントになっているか。

  • XSCF側で、ファームの再起動やファームアップなどの操作や、XSCFのフェイルオーバなどの事象が発生していなかったか。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、SNMP非同期監視機能およびシャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /etc/opt/FJSVcluster/bin/clsnmpmonctl stop
# /etc/opt/FJSVcluster/bin/clsnmpmonctl start
# /opt/SMAW/bin/sdtool -b
<対処4>
  • シャットダウン機構で使用するSNMPトラップ受信デーモン(snmptrapd)のポート番号(9385番)が他製品のポート番号と重複していないか。

上記項目が原因だと判明した場合、“PRIMECLUSTER 導入運用手引書 (Oracle Solaris)”の“SNMPに関するポート番号の変更”を参照し、ポート番号を変更してください。

<対処5>
  • シャットダウン機構のSMFサービス(svc:/milestone/fjsvcldevtrap)の状態がonlineになっているか。

    以下のコマンドを実行し、fjsvcldevtrap サービスの状態を確認してください。

    # svcs svc:/milestone/fjsvcldevtrap

disabledまたはmaintenance状態の場合は、以下の対処を行ってください。

# /opt/SMAW/bin/sdtool -e
# /etc/opt/FJSVcluster/bin/clsnmpmonctl stop
# /etc/opt/FJSVcluster/bin/clsnmpmonctl start
# /opt/SMAW/bin/sdtool -b
<対処6>
  • XSCF のSNMP エージェントが正しく動作できているか。

    XSCF ログインし、showsnmp コマンドを実行して、実行結果を確認してください。

    XSCF> showsnmp

    [確認点]

    • "Agent Status: Enabled" が出力されていること

    • "Enabled MIB Modules: None" が出力されていないこと

上記の確認点と異なる出力がされた場合は、以下のコマンドをXSCF 上で実施してください。

XSCF> setsnmp disable
XSCF> setsnmp enable

その後、すべてのクラスタノードで以下の手順を実施してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

<その他の対処>

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や XSCF または HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、“PRIMECLUSTER 活用ガイド<トラブルシューティング編>”を参照してください。

SA Shutdown Agent to init host nodename failed

内容

ノード <nodename> に対するシャットダウンエージェント <Shutdown Agent> の初期化処理に失敗しました。

対処

以下の点を確認してください。

<対処1>

シャットダウンエージェントが正しく設定されているか確認してください。シャットダウンエージェントの設定については、"PRIMECLUSTER 導入運用手引書"を参照してください。

<対処2>

非同期監視機能が起動しているか確認してください。非同期監視機能が起動済みかの確認方法は、"PRIMECLUSTER 導入運用手引書"を参照してください。非同期監視機能を停止している場合は、以下の手順を実施してください。

  1. シャットダウン機構を停止してください。

    # /opt/SMAW/bin/sdtool -e
  2. 環境に応じた非同期監視デーモンを起動してください。非同期監視デーモンの起動方法については、"PRIMECLUSTER 導入運用手引書"を参照してください。

  3. シャットダウン機構を起動してください。

    # /opt/SMAW/bin/sdtool -b

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA Shutdown Agent to test host nodename failed

内容

メッセージが表示されたノードから、ノード nodename の接続先への接続確認に失敗しました。

なお、接続先は各シャットダウンエージェントにより異なります。

対処

以下の点を確認してください。なお、以下の接続先は各シャットダウンエージェントにより異なります。

  • システムまたはネットワークに負荷がかかっていないか。

    10分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • シャットダウンデーモンの設定(/etc/opt/SMAW/SMAWsf/rcsd.cfg)、および、シャットダウンエージェントの設定が正しいか。

  • 接続先側の設定が正しいか。

  • 接続先への接続方法に SSH を使用している場合、シャットダウン機構用のログインユーザアカウントを使用して、クラスタノードから接続先へ SSH 接続し、SSH 初回接続時のユーザ問い合わせ(RSA 鍵の生成など)が完了しているか。

  • 接続先への接続方法に SSH を使用している場合、クラスタノードから接続先へ SSH 接続する際のユーザ認証方法としてパスワード認証を使用しているか。

    公開鍵認証などパスワード認証を自動化する認証方法を接続先で使用している場合は、無効化してください。

  • 接続先へのケーブルが正しく接続されているか。

上記項目が原因だと判明した場合、対処を行った上で、メッセージが出力されたノードで以下のコマンドを実行し、シャットダウン機構を再起動してください。なお、非同期監視機能の再起動も必要なシャットダウンエージェントもあります。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や 接続先、あるいは HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

SA Shutdown Agent to unInit host nodename failed

内容

ノード <nodename> に対するシャットダウンエージェント <Shutdown Agent> の終了時処理に失敗しました。

対処

調査用の情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

select of CLI Pipe & RCSDNetPipe failed, errno errno

内容

シャットダウンデーモン中の select 関数が異常復帰しました。

対処

シャットダウン機構が、CLI のパイプを再開させる動作を行います。また、システムで動く他のプロセスへの影響はないので、対処不要です。

string in file file around line number

内容

rcsd.cfg 内の構文が正しくありません。

対処

構文を修正してください。

The attempted shutdown of cluster host nodename has failed

内容

システム内部の問題です。

対処

このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The authentication request failed.

内容

  • SA_vmk5r 使用時

    メッセージが表示されたノードで、認証要求に失敗しました。

  • SA_vmosr 使用時

    Identityサービスのエンドポイントに対して認証トークンの要求に失敗しました。

対処

  • SA_vmk5r 使用時

    以下の点を確認してください。

    • システムまたはネットワークに負荷がかかっていないか。

    • /opt/SMAW/SMAWRrms/etc/k5_endpoint.cfg に指定した、FJcloud-O の環境情報が正しいか。

      /opt/SMAW/SMAWRrms/etc/k5_endpoint.cfg の指定については、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "FJcloud-O 環境情報ファイルの作成" を参照してください。

    • /etc/opt/SMAW/SMAWsf/SA_vmk5r.cfg に指定した、仮想サーバの強制停止用のユーザ名、パスワードが正しいか。

      /etc/opt/SMAW/SMAWsf/SA_vmk5r.cfgの指定については、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第1部 FJcloud-O 環境編" の "シャットダウン機構の設定" を参照してください。

    • クラスタホストが動作している仮想サーバから、FJcloud-O のリージョナル利用者管理のエンドポイントと通信が行える状態になっているか。

  • SA_vmosr 使用時

    以下の点を確認してください。

    • システムまたはネットワークに負荷がかかっていないか。

      10 分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

      # /opt/SMAW/bin/sdtool -s
    • 以下の指定が正しいか。

      • /opt/SMAW/SMAWRrms/etc/os_endpoint.cfg

      • /etc/opt/SMAW/SMAWsf/SA_vmosr.cfg

      RHOSP のインスタンス制御用のユーザのパスワードについては、/opt/SMAW/bin/sfcipher コマンドで暗号化したものを指定する必要があります。

      これらのファイルの指定については、"PRIMECLUSTER 導入運用手引書 (Linux)" を参照してください。

    • クラスタホストが動作しているインスタンスから、RHOSP の Identity サービスに通信が行える状態になっているか。

    上記項目を確認しても接続に失敗する場合は、ネットワーク障害や HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The AWS CLI execution failed.

内容

AWS CLI の実行に失敗しました。

対処

AWS CLI が root ユーザでインストールされているか確認してください。

AWS CLI のインストールに関しては、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "AWS Command Line Interface のインストール" を参照してください。

上記項目を確認しても処理に失敗する場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The Azure CLI execution failed.

内容

Azure CLI の実行に失敗しました。

対処

Azure CLI が root ユーザでインストールされているか確認してください。

Azure CLI のインストールに関しては、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "Azure コマンドラインインタフェースのインストール" を参照してください。

上記項目を確認しても処理に失敗する場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The configuration file /etc/opt/SMAW/SMAWsf/SA_vmawsReset.cfg does not exist.
The configuration file /etc/opt/SMAW/SMAWsf/SA_vmawsAsyncReset.cfg does not exist.

内容

AWS CLI(SA_vmawsReset、SA_vmawsAsyncReset)シャットダウンエージェントの構成定義ファイルが存在しません。

対処

AWS CLI(SA_vmawsReset、SA_vmawsAsyncReset)シャットダウンエージェントの構成定義ファイルを作成してください。

構成定義ファイルの作成に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第4部 AWS 環境編" の "シャットダウン機構の設定" を参照してください。

The configuration file /etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfg does not exist.

内容

Azure(SA_vmazureReset)シャットダウンエージェントの構成定義ファイルが存在しません。

対処

Azure(SA_vmazureReset)シャットダウンエージェントの構成定義ファイルを作成してください。

構成定義ファイルの作成に関する詳細は、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第5部 Azure 環境編" の "シャットダウン機構の設定" を参照してください。

The configuration file /etc/opt/SMAW/SMAWsf/SA_vmosr.cfg does not exist.

内容

OpenStack API(SA_vmosr) シャットダウンエージェントの構成定義ファイルが存在しません。

対処

OpenStack API(SA_vmosr) シャットダウンエージェントの構成定義ファイルを作成してください。

The configuration file /opt/SMAW/SMAWRrms/etc/os_endpoint.cfg does not exist.

内容

RHOSP 環境情報ファイルが存在しません。

対処

RHOSP 環境情報ファイルを作成してください。

The configuration file configfile does not exist

内容

メッセージが表示されたノードに、コンフィグファイル configfile が存在しません。

対処

以下を参照し、コンフィグファイル configfile を作成してください。

  • configfile が/opt/SMAW/SMAWRrms/etc/k5_endpoint.cfg の場合

    "PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "FJcloud-O 環境情報ファイルの作成"

  • configfile が/etc/opt/SMAW/SMAWsf/SA_vmk5r.cfg の場合

    "PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第1部 FJcloud-O 環境編" の "シャットダウン機構の設定"

The information acquisition request of the virtual machine instance-id failed.

内容

AWS のエンドポイントに対して、仮想マシンの情報取得要求に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

    10 分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • 構成定義ファイル(/etc/opt/SMAW/SMAWsf/SA_vmawsAsyncReset.cfg)の指定が正しいか。

    • instance-id には、PRIMECLUSTER がインストールされている環境の情報を設定する必要があります。

    • instance-id の設定に関しては、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第4部 AWS 環境編" の "シャットダウン機構の設定" を参照してください。

  • クラスタホストが動作しているインスタンスから AWS のエンドポイントに通信が行える状態になっているか。

  • AWS CLI がインストールされており、認証情報が設定されているか。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The information acquisition request of the virtual machine instancename failed.

内容

Compute サービスのエンドポイントに対して、仮想マシンの情報取得要求に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

    10 分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • 以下の指定が正しいか。

    • /opt/SMAW/SMAWRrms/etc/os_endpoint.cfg

    • /etc/opt/SMAW/SMAWsf/SA_vmosr.cfg

    RHOSP のインスタンス制御用のユーザのパスワードについては、/opt/SMAW/bin/sfcipher コマンドで暗号化したものを指定する必要があります。

    これらのファイルの指定については、"PRIMECLUSTER 導入運用手引書 (Linux)" を参照してください。

  • RHOSP のインスタンス制御用のユーザに admin ロールが付与されているか。

  • クラスタホストが動作しているインスタンスから、RHOSP の Compute サービスに通信が行える状態になっているか

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The information acquisition request of the virtual machine resource-id failed.

内容

Azure のエンドポイントに対して、仮想マシンの情報取得要求に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

    10 分後に本メッセージが表示されていない場合、復旧していることがあります。以下のコマンドを実行し、シャットダウン機構が正常に動作していることを確認してください。

    # /opt/SMAW/bin/sdtool -s
  • 構成定義ファイル (/etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfg) の指定が正しいか。

    • resource-id には、PRIMECLUSTER がインストールされている仮想マシンのリソースIDを設定する必要があります。

    • resource-id の設定に関しては、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第5部 Azure 環境編" の "シャットダウン機構の設定" を参照してください。

  • クラスタホストが動作している仮想マシンから Azure のエンドポイントに通信が行える状態になっているか。

  • Azure CLI がインストールされており、サービスプリンシパルが登録されているか。

  • サービスプリンシパルの証明書ファイルを配置したファイルパスをAzure (SA_vmazureReset) シャットダウンエージェントの構成定義ファイルのCertPathに指定しているか。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The information acquisition request of the virtual machine ServerName failed.

内容

メッセージが表示されたノードで、仮想サーバ ServerName の情報取得要求に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

  • /opt/SMAW/SMAWRrms/etc/k5_endpoint.cfg に指定した、FJcloud-O の環境情報が正しいか。

    /opt/SMAW/SMAWRrms/etc/k5_endpoint.cfg の指定については、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "FJcloud-O 環境情報ファイルの作成" を参照してください。

  • /etc/opt/SMAW/SMAWsf/SA_vmk5r.cfg に指定した、仮想サーバ名、仮想サーバの強制停止用のユーザ名、パスワードが正しいか。

    /etc/opt/SMAW/SMAWsf/SA_vmk5r.cfg の指定については、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第1部 FJcloud-O 環境編" の "シャットダウン機構の設定" を参照してください。

  • クラスタホストが動作しているインスタンスから、FJcloud-O のコンピュート(スタンダードサービス)のエンドポイントと通信が行える状態になっているか。

上記対処によってこのエラーを解決できない場合は、このメッセージを記録して、調査用の情報を採取します。

その後、当社技術員(SE)に連絡してください。

調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The SF-CF event processing failed string, status value

内容

シャットダウン処理中に"status 6147"が表示された場合、他ノードからの停止通知を受信したことを示しています。

その他はシステム内部の問題です。

対処

シャットダウン処理中に"status 6147"が表示された場合は対処不要です。

上記以外の場合は、このメッセージを記録して、調査用の情報を採取してください。その後、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The SF-CF has failed to locate host nodename

内容

rcsd.cfg 内のノード名が CF ノード名ではありません。

対処

rcsd.cfg 内のノード名に CF ノード名を指定してください。CF ノード名は cftool -n コマンドで確認してください。

rcsd.cfg の修正後、以下のコマンドを実行し、シャットダウン機構を再起動してください。

# /opt/SMAW/bin/sdtool -e
# /opt/SMAW/bin/sdtool -b

本対処法で対処できない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The SF-CF initialization failed, status value

内容

CFの構成が行われていないか、ロードされていない可能性があります。

対処

CF の設定を実施してください。
設定方法は以下を参照してください。

"PRIMECLUSTER Cluster Foundation導入運用手引書" の "クラスタの作成例"

The specified guest domain cannot be connected. (nodename:nodename)

内容

指定されたゲストドメイン nodename への接続ができません。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

    一時的な負荷であれば対処は不要です。

  • 設定されたゲストOS の情報が正しいか。

    • Linux 版 4.3A30以降の場合

      /etc/opt/FJSVcluster/etc/kvmguests.conf に設定されたゲストOS の情報が正しいかを確認してください。
      ゲストOS の情報に誤りがある場合は、kvmguests.conf ファイルの情報を再設定してください。

    • Solaris 版 4.3A20 以降の場合

      clovmmigratesetup -l コマンドを実行し、ゲストOSの情報が正しいかを確認してください。
      ゲストOS の情報に誤りがある場合は正しいゲストOSの情報を再設定してください。
      clovmmigratesetup コマンド実行時にゲストOSの情報が出力される場合は、設定する内容が正しいかを確認してください。

  • 指定されたゲストOS への接続ができるか。

    ゲストOS に接続できない場合は、ネットワークの設定を見直してください。
    ゲストOS にシャットダウン機構用の一般権限ユーザが登録されているかを確認してください。

  • root ユーザ、または、シャットダウン機構用の一般権限ユーザを使用して管理OS からゲストOS へ SSH 接続し、SSH 初回接続時のユーザ問い合わせ(RSA 鍵の生成など)が完了しているか。

    SSH 初回接続時のユーザ問い合わせ(RSA 鍵の生成など)が完了していない場合は、完了させてください。

本対処法で対処できない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The stop request of the virtual machine instance-id failed.

内容

AWS のエンドポイントに対して、仮想マシンの停止要求に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

  • 構成定義ファイル (/etc/opt/SMAW/SMAWsf/SA_vmawsAsyncReset.cfg) の指定が正しいか。

    • instance-id には、PRIMECLUSTER がインストールされている環境の情報を設定する必要があります。

    • instance-id の設定に関しては、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第4部 AWS 環境編" の "シャットダウン機構の設定" を参照してください。

  • クラスタホストが動作しているインスタンスから AWS のエンドポイントに通信が行える状態になっているか。

  • AWS CLI がインストールされており、認証情報が設定されているか。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The stop request of the virtual machine instancename failed.

内容

Compute サービスのエンドポイントに対して、仮想マシンの停止要求に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

  • 以下の指定が正しいか。

    • /opt/SMAW/SMAWRrms/etc/os_endpoint.cfg

    • /etc/opt/SMAW/SMAWsf/SA_vmosr.cfg

    RHOSP のインスタンス制御用のユーザのパスワードについては、/opt/SMAW/bin/sfcipher コマンドで暗号化したものを指定する必要があります。

    これらのファイルの指定については、"PRIMECLUSTER 導入運用手引書 (Linux)" を参照してください。

  • RHOSP のインスタンス制御用のユーザに admin ロールが付与されているか。

  • クラスタホストが動作しているインスタンスから、RHOSP の Compute サービスに通信が行える状態になっているか。

上記項目を確認しても接続に失敗する場合は、ネットワーク障害や HUB などのハードウェア故障が考えられるので、当社技術員(CE)に連絡してください。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The stop request of the virtual machine resource-id failed.

内容

Azure のエンドポイントに対して、仮想マシンの停止要求に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

  • 構成定義ファイル (/etc/opt/SMAW/SMAWsf/SA_vmazureReset.cfg) の指定が正しいか。

    • resource-id には、PRIMECLUSTER がインストールされている仮想マシンのリソースIDを設定する必要があります。

    • resource-id の設定に関しては、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第5部 Azure 環境編" の "シャットダウン機構の設定" を参照してください。

  • クラスタホストが動作している仮想マシンから Azure のエンドポイントに通信が行える状態になっているか。

  • Azure CLI がインストールされており、サービスプリンシパルが登録されているか。

  • サービスプリンシパルの証明書ファイルを配置したファイルパスをAzure (SA_vmazureReset) シャットダウンエージェントの構成定義ファイルのCertPathに指定しているか。

本対処法で復旧しない場合は、このメッセージを記録して、調査情報を採取し、当社技術員(SE)に連絡してください。調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。

The stop request of the virtual machine ServerName failed.

内容

メッセージが表示されたノードで、仮想サーバ ServerName の停止要求に失敗しました。

対処

以下の点を確認してください。

  • システムまたはネットワークに負荷がかかっていないか。

  • /opt/SMAW/SMAWRrms/etc/k5_endpoint.cfg に指定した、FJcloud-O の環境情報が正しいか。

    /opt/SMAW/SMAWRrms/etc/k5_endpoint.cfg の指定については、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "FJcloud-O 環境情報ファイルの作成" を参照してください。

  • /etc/opt/SMAW/SMAWsf/SA_vmk5r.cfg に指定した、仮想サーバ名、仮想サーバの強制停止用のユーザ名、パスワードが正しいか。

    /etc/opt/SMAW/SMAWsf/SA_vmk5r.cfg の指定については、"PRIMECLUSTER 導入運用手引書<Cloud Services編>" の "第1部 FJcloud-O 環境編" の "シャットダウン機構の設定" を参照してください。

  • クラスタホストが動作している仮想サーバから、FJcloud-O のコンピュート(スタンダードサービス)のエンドポイントと通信が行える状態になっているか。

上記対処によってこのエラーを解決できない場合は、このメッセージを記録して、調査用の情報を採取します。

その後、当社技術員(SE)に連絡してください。

調査情報の採取方法については、"PRIMECLUSTER 活用ガイド<トラブルシューティング編>" を参照してください。