Linux OS 固有のトラブルについて説明します。
■トラブル一覧
No. | 現象 |
---|---|
Adaptec ドライバをアップデートし、リブートを行ったところ、シングルユーザモードでシステムが起動される | |
NIC 増設後に既存の NIC での通信が不可となる | |
OS のインストール時に RAID の内蔵ドライブが認識されない | |
システムがシングルユーザモードで起動される | |
システムがシングルユーザモードで起動される【RHEL v2.1】 | |
システムが突然リブートされる | |
システム起動時に Netdump のサービスが自動起動されない【PRIMECLUSTER 4.1A20 以降 と RHEL v3 の組み合わせ】 | |
Netdump の採取ができない【PRIMECLUSTER 4.1A20 以降 と RHEL v3 の組み合わせ】 | |
Netdump を採取したところ、ノードがハングしたまま応答が返らない【PRIMECLUSTER 4.1A20以降 とRHEL v3 の組み合わせ】 | |
KVM 環境でゲスト OS を起動すると以下のエラーメッセージが表示され、起動できない |
initrd の作成時には、マルチパスドライバが提供している mkinitrd コマンド(/usr/fjsvgrmpd/bin/mkinitrd-mpd) を実行してください。
OS 標準の mkinitrd コマンドを実行していませんか?
PCI-PCI Bridge の割り込み優先順位により、NIC の優先順位が変わるハードウェア仕様のため、通信が不可になる場合があります。
PRIMERGY 本体添付のマニュアルに従い NIC の挿入位置を決定してください。
もし、何らかの理由で NIC の挿入位置が変更できない場合は、新たに割り当てられたネットワークインタフェース名のまま使用することを検討してください。NIC とネットワークインタフェース名の関係は、ipコマンド または ifconfig コマンドで表示される MAC アドレスを元に判断することができます。
インタフェース名が変わっていませんか?
OS 導入前に論理ドライブが作成されていない可能性があります。
RAID 接続のドライブは、OS 導入前に RAID カードの BIOS/ 専用ユーティリティにより論理ドライブを作成する必要があります。
内蔵ドライブの現調が終わっていますか?
適切な RAID ドライバが使用されていない可能性があります。
ハードウェアにバンドルされる KickStart にてインストールを行ってください。
もし、何らかの理由で KickStart によるインストールを行わない場合には、ご使用のモデルに対応したRAID ドライバを以下の方法でドライバフロッピーからインストールする必要があります。
インストール時のboot:プロンプトにて、linux dd noprobe と入力します。
インストーラの指示に従いドライバフロッピーを挿入、SCSI の項より適切なドライバを選択します。
なお、この場合は NIC のドライバも自動認識されないため、別途導入する必要があります。
適切な RAID ドライバが使用されていますか?
システムで必須としているパーティションでエラーが発生している可能性があります。
コンソールに表示されているメッセージからエラーの発生しているパーティションを特定し、fsck コマンド等での修復やバックアップからの復旧を試みてください。
コンソールメッセージがスクロールして画面から消えてしまった場合には、[Shift]+[PageUp]/[PageDown] でスクロールが可能です。
システムで使用しているパーティションで障害が発生していませんか?
LKCD シャットダウンエージェントが有効となっている場合、システム起動時にパニックステータス通知ディスク上のパニックステータスがクリアされていない可能性があります。
パニックステータスのクリアに失敗した場合、クラスタへの参加を回避するためシングルユーザモードへと移行します。その際、共用ディスク装置を接続/起動してください。
もし、何らかの理由で共用ディスク装置がない状態でマルチユーザモードで起動する場合は、LKCD シャットダウンエージェントを無効にすることで回避できます。
詳細は、"PRIMECLUSTER 導入運用手引書 (Linux)" の "シャットダウン機構の設定に関する注意事項" を参照してください。
RHEL AS/ES 2.1 の場合、共用ディスク装置 (GR/ETERNUS) が未起動あるいは未接続ではありませんか?
ハードエラーによってハートビート異常が発生して、ノードが強制停止された可能性があります。
ServerView のログにエラーメッセージが出力されていないか確認してください。
ハードエラーが出力されている場合は、サポートデスクにご連絡ください。
ハード異常が発生していませんか?
パニックの発生により、システムが自動的にリブートされた可能性があります。
システムのリブート後、障害調査に必要なシステムおよびクラスタの情報を fjsnap(4.2A00以前はpclsnap) で採取し、サポートデスクにご連絡ください。
パニックが発生していませんか?
クラスタインタコネクトに対応するインタフェースに異常が発生した可能性があります。
ケーブル断、NIC 異常、コネクタ不良等、クラスタインタコネクトを構成するネットワークの異常を確認してください。
上記以外の原因で発生している場合は、全ノードで障害調査に必要なシステムおよびクラスタの情報をfjsnap(4.2A00以前はpclsnap) で採取し、サポートデスクにご連絡ください。
cip 情報の表示 (/opt/SMAW/SMAWcf/bin/ciptool -n コマンド) にて、down 状態のインタフェースがありませんか?
Netdump で使用する LAN 環境で、スイッチングハブを使用している場合、STP (Spanning-Tree Protocol) の設定により、サービスが自動起動されない場合があります。
STP の設定に値(秒)が指定されている場合、ノード起動時にネットワークの Link-up が指定された秒間制御されます。使用しているスイッチングハブの STP の設定を "Disabled" に設定してください。
詳細は、Netdump クラスタ連携ツールのマニュアルを参照してください。
Netdump 用の LAN と業務 LAN を分けてください。
Netdump で使用している LAN とGLS で使用している業務 LAN を共用していませんか?
Netdump クライアントで Netdump 用にオンボード LAN を使用している可能性があります。
RedHat 社提供のディストリビューションに含まれていない IHV ベンダのドライバ (broadcom 等)を使用しているオンボード LAN は、LAN ドライバが未サポートのため、ダンプ採取用途には使用できません。Netdump 用の LAN を別途用意してください。
詳細は、Netdump クラスタ連携ツールのマニュアルを参照してください。
Netdump クライアントにて、Netdump 用にオンボード LAN を使用していませんか?
注意
Update3 (U05011) を適用している場合、オンボード LAN (broadcom) を使用しても問題ありません。
サーバ側にクライアントノードの実メモリ +600MB 程度の領域を確保してください。
不要なファイルデータ等があれば、削除しておいてください。
また、システム設計時にも Netdump を利用する際の考慮をする必要があります。
Netdump サーバの空き領域が不足していませんか?
マイグレーション機能を使用する場合の事前準備において、以下が行われていません。
すべての管理 OS への管理 OS の情報ファイルの配置 (管理 OS 異常切替機能を使用しない場合)
すべての管理 OS での管理 OS の情報登録 (管理 OS 異常切替機能を使用する場合)
ゲスト OS のある管理 OS で以下を実施してください。
# virsh detach-disk domain vdpcl --persistent
ゲスト OS のドメイン名を指定します。
"PRIMECLUSTER導入運用手引書 (Linux)" の "KVM環境でマイグレーション機能を使用する場合" の "事前設定"を再度実施してください。
管理 OS の情報ファイル (/var/opt/SMAWsf/sfkvmmigrate.img) が誤って削除されています。
ゲスト OS のある管理 OS で以下を実施してください。
# virsh detach-disk domain vdpcl --persistent
ゲスト OS のドメイン名を指定します。
"PRIMECLUSTER導入運用手引書 (Linux)" の "KVM環境でマイグレーション機能を使用する場合" の "事前設定"を再度実施してください。
管理 OS からの PRIMECLUSTER のアンインストール時に、マイグレーション機能を使用する場合の事前設定が解除されていません。
ゲスト OS のある管理 OS で以下を実施してください。
# virsh detach-disk domain vdpcl --persistent
ゲスト OS のドメイン名を指定します。