PRIMECLUSTER 活用ガイド <クラスタ構築・運用時の留意点> (Solaris(TM)オペレーティングシステム/Linux版) |
目次
索引
![]() ![]() |
第1部 設計・構築編 | > 第4章 Fsystem リソース設定時の注意点 |
Fsystem の Online 処理では、fsck が実行される場合があります。
Online 処理中に fsck が実行されると、Online 処理が ScriptTimeout で設定された時間内に完了しない場合があります。この結果、起動や切替え処理が失敗します。
このため、Fsystem を使用する場合は、fsck の処理時間を考慮した Scripttimeout 値を設定する必要があります。
Fsystem で指定したマウントポイントは、userApplication 以外からはアクセスしないでください。
もし、Offline 処理中に他のプロセスで Fsystem で指定したマウントポイントをアクセスしていると、Offline 処理に失敗し切替えができない場合があります。
userApplication が Online の状態では、mv コマンドなどを使って Fsystem のマウントポイント名を変更しないでください。
Online 状態でマウントポイント名を変更すると、hvdet_gmount が異常を検出しuserApplication の切替えが発生します。一時的にマウントポイントを変名する場合には、RMS を停止した状態で行ってください。
1つの Fsystem リソースに登録したマウントポイント数が31個以上の場合、タイムアウト値をデフォルト(180秒)から変更する必要があります。
Fsystem リソースのTimeout属性には、「1つの Fsystem リソースに登録したマウントポイント数 × 6秒」以上を設定する必要があります。
例えば、1つのFsystemリソースに31個のマウントポイントを登録した場合には、FsystemリソースのTimeout属性に「31×6秒=186秒」以上を設定してください。
各Fsystemリソースに設定されているタイムアウト値は、そのFsystemリソースに登録されているマウントポイントのすべての処理が終わるまでの時間になります。
たとえば、Fsystemリソースに、/mnt1、/mnt2、/mnt3の3つのマウントポイントが登録されていて、かつ、タイムアウト値に100秒を設定した場合、3つ全てのマウントポイントの処理(マウント/アンマウント)が100秒で完了しなければタイムアウトになります。
Fsystem リソースで使用するディスクパーティションには、あらかじめファイルシステムを作成しておく必要があります。
ファイルシステムが作成されていない場合、Online 処理が失敗します。
共用ディスクへアクセスできない状態になった場合、double fault が発生する場合があります。
共用ディスクへアクセスできない状態になった場合、Fsystem リソースが Faulted 状態になります。このとき、Faulted 処理の延長で行われる Offline 処理でマウントポイントのアンマウント処理が行えず、double fault が発生する場合があります。
強制ファイルシステムチェックが実行されないようにしてください。
ファイルシステムにext3 を使用している場合、切替ファイルシステムのオンライン処理時に強制的なファイルシステムチェックが実行されることがあります。この強制的なファイルシステムチェックの実行は ext3 の仕様であり、前回のファイルシステムチェックから一定回数のマウントが実行された、あるいは一定期間経過したことを契機に実行されるものです。
両ノード起動時や切替え時などに強制的なファイルシステムチェックが実行されると、ファイルシステムのオンライン処理でタイムアウトが発生し、PRIMECLUSTER の起動や切替えに失敗することがあります。
このような状況を回避するため、すべての ext3 切替ファイルシステムに対して次のコマンドを実行し、強制ファイルシステムチェックが実行されないように設定してください。
# tune2fs -c0 -i0 <デバイス名>
例)
# tune2fs -c0 -i0 /dev/sdi1
上記コマンド実行後、次のコマンドで "Maximum mount count :-1","Check interval:0" となっていることを確認してください。
# tune2fs -l /dev/sdi1 [snip] Mount count: 10 Maximum mount count: -1 [snip] Check interval: 0 (<none>) [snip]
上記のように強制的なファイルシステムチェックが実行されない設定とした場合、ファイルシステムのロギングやジャーナリングだけでは検知できない原因(ディスク故障、カーネルバグなど)によるファイルシステム破壊が発生すると、その発見が遅れるため、データ損失の危険性が高まります。定期保守において、手動でファイルシステムの強制チェック(fsck -f)を実行して、データ損失の危険性を回避してください。
目次
索引
![]() ![]() |