データの削除やsearcherの増設または縮退などにより、searcherごとのデータ量やサーチデータファイルのデータ量に偏りが大きくなった場合は、サーチデータの再配置が必要になります。
サーチデータを再配置することにより、searcherごとのデータ量の偏りを解消することができます。
Shunsakuの検索速度は、サーチデータの最大データ量を持つsearcherに依存します。searcherごとのデータ量の偏りが大きい場合には、サーチデータの再配置を行います。データ量の偏りを解消することにより、最大データ量が減少するため、検索性能が向上します。
サーチデータの再配置を行うかどうかの判断は、以下の情報を参考にしてください。
searcherごとのサーチデータ量の偏りが大きい。
フラグメンテーション率が大きい。
オーバーフロー制御機能を使用している場合、サーチデータファイルにデータが格納されている。
サーチデータ量(DataSize)、フラグメンテーション率(Fragments)およびサーチデータファイルの使用量(DataFileSize)の情報は、shundstateコマンドのp diskオプションを実行することにより参照できます。
参考
フラグメンテーションとは、データの断片化を意味します。断片化とは、データが分散して配置された状態で、その比率に応じてアクセス効率も劣化します。
フラグメンテーション率は、searcher用動作環境ファイルのSearchDataFileFolderパラメタで指定したサーチデータファイルに格納されている必要なデータと、削除および更新によって不要となったデータの割合を示しています。
フラグメンテーション率が大きいほど、ディスクの使用量が増加します。たとえば、フラグメンテーション率が75%であれば必要なデータは25%(100%-75%)のため、ディスク使用量は実際のデータ量の4倍(100%÷25%)になります。
ディスクの空き容量やディスク性能をもとに、サーチデータの再配置を行うか否かを判断してください。
図4.4 サーチデータを再配置する場合の運用例
サーチデータの再配置は、以下の手順で行います。
shundstateコマンドを実行し、接続searcher情報からsearcherごとのサーチデータ量(DataSize)、フラグメンテーション率(Fragments)またはサーチデータファイルの使用量(DataFileSize)を確認します。
shundstate -s director識別子 -p disk
searcherごとのデータ量に偏りが見られる場合、shundresendコマンドを実行し、サーチデータの再配置を行います。
shundresend -s director識別子
shundstateコマンドを実行し、接続searcher情報から、searcherごとのサーチデータのデータ量が均等になった、または、サーチデータファイルを使用しているsearcherがなくなったことを確認します。
shundstate -s director識別子 -p disk
参照
shundstateコマンドの出力表示については、“6.2.3 director運用情報のモニタリング”を参照してください。
注意
shundresendコマンドとアプリケーション、shundresendコマンドと他のコマンドとの競合関係については、“付録E 競合関係”を参照してください。