YARNに関連するチューニングパラメーターについて以下に説明します。
本機能では、設定を行っていません。そのため、デフォルト値の 1000MB となります。
ResourceManagerのヒープサイズの推奨値は、スレーブサーバ台数によって決定します。ノード数が10ノード程度の小さなクラスタでは2GB、50ノード程度の平均的なクラスタでは4GBを推奨しています。
ファイル名:/etc/opt/FJSVbsb/bdpp/Hadoop/yarn-env.sh
パラメーター名:YARN_RESOURCEMANAGER_HEAPSIZE
例
ResourceManagerのヒープサイズを2GB(2048MB)に設定する例:
export YARN_RESOURCEMANAGER_HEAPSIZE=2048
本機能では、設定を行っていません。そのため、デフォルト値の 1000MB となります。
NodeManagerのヒープサイズの推奨値は、スレーブサーバ台数によって決定します。ノード数が数十ノードのクラスタでは1GB、数百ノードの大規模なクラスタでは2-4GBを推奨します。
ファイル名:/etc/opt/FJSVbsb/bdpp/Hadoop/yarn-env.sh
パラメーター名:YARN_NODEMANAGER_HEAPSIZE
例
NodeManagerのヒープサイズを1GB(1024MB)に設定する例:
export YARN_NODEMANAGER_HEAPSIZE=1024
NodeManagerがコンテナに割り当てることができるCPUコア数の最大値を指定します。
本機能では、NodeManagerが動作するサーバの搭載コア数から値を設定しています。
NodeManagerが動作するサーバの搭載コア数 - 1
本パラメーターの推奨値は、以下になります。
NodeManagerが動作するサーバの搭載コア数 - 3(OS、DataNode、NodeManager)
ファイル名:/etc/opt/FJSVbsb/bdpp/hadoop/yarn-site.xml
例
NodeManagerがコンテナに割り当てることができるCPUコア数の最大値を10 に設定する例:
<property> <name>yarn.nodemanager.resource.cpu-vcores</name> <value>10</value> </property>
NodeManagerがコンテナに割り当てることができるメモリの最大サイズを指定します。
本機能では、NodeManagerが動作するサーバの搭載メモリサイズから値を設定しています。
NodeManagerが動作するサーバの搭載メモリサイズ(MB) - 2048(MB)
本パラメーターの推奨値は、以下になります。
NodeManagerが動作するサーバの搭載メモリサイズ(MB) - 3072(MB)
ファイル名:/etc/opt/FJSVbsb/bdpp/hadoop/yarn-site.xml
例
NodeManagerがコンテナに割り当てることができる最大メモリサイズを10GB(10240MB) に設定する例:
<property> <name>yarn.nodemanager.resource.memory-mb</name> <value>10240</value> </property>
ResourceManagerへのコンテナ割り当て要求が可能な最小CPUコア数を指定します。
本機能では、設定を行っていません。そのため、デフォルト値の 1 となります。
本パラメーターの推奨値は、1です。
ファイル名:/etc/opt/FJSVbsb/bdpp/hadoop/yarn-site.xml
例
ResourceManagerへのコンテナ割り当て要求が可能な最小CPUコア数を1 に設定する例:
<property> <name>yarn.scheduler.minimum-allocation-vcores</name> <value>1</value> </property>
ResourceManagerへのコンテナ割り当て要求が可能な最大CPUコア数を指定します。
本機能では、設定を行っていません。そのため、デフォルト値の 32 となります。
本パラメーターの推奨値は、以下になります。
NodeManagerが動作するサーバの搭載CPUコア数 - 3(OS、DataNode、NodeManager)
ファイル名:/etc/opt/FJSVbsb/bdpp/hadoop/yarn-site.xml
例
ResourceManagerへのコンテナ割り当て要求が可能な最大CPUコア数を10 に設定する例:
<property> <name>yarn.scheduler.maximum-allocation-vcores</name> <value>10</value> </property>
ResourceManagerへのコンテナ割り当て要求が可能な最小メモリサイズを指定します。
本機能では、設定を行っていません。そのため、デフォルト値の 1024(MB) となります。
本パラメーターの推奨値は、1024MBです。
ファイル名:/etc/opt/FJSVbsb/bdpp/hadoop/yarn-site.xml
例
ResourceManagerへのコンテナ割り当て要求が可能な最小メモリサイズを1024MB に設定する例:
<property> <name>yarn.scheduler.minimum-allocation-mb</name> <value>1024</value> </property>
ResourceManagerへのコンテナ割り当て要求が可能な最大メモリサイズを指定します。
本機能では、NodeManagerが動作するサーバの搭載メモリサイズから値を設定しています。
NodeManagerが動作するサーバの搭載メモリサイズ(MB) - 2048(MB)
本パラメーターの推奨値は、以下になります。
NodeManagerが動作するサーバの搭載メモリサイズ(MB) - (OSで利用するメモリ容量、DataNodeのヒープサイズ、NodeManagerのヒープサイズ)
ファイル名:/etc/opt/FJSVbsb/bdpp/hadoop/yarn-site.xml
例
ResourceManagerへのコンテナ割り当て要求が可能な最大メモリサイズを10240MB に設定する例:
<property> <name>yarn.scheduler.minimum-allocation-mb</name> <value>10240</value> </property>
コンテナが中間ファイルを格納するディレクトリを指定します。
本機能では、以下のディレクトリを設定しています。
file:///var/opt/FJSVbsb/bdpp/lib/hadoop/yarn/local
本パラメーターの推奨値は、内蔵ディスク上のディレクトリです。
カンマ区切りで複数のディレクトリを指定することができます。
複数のディレクトリを指定した場合、ディスクI/Oが分散され、中間データの読み書きのパフォーマンスが向上するため、複数のディレクトリを指定することを推奨します。
ファイル名:/etc/opt/FJSVbsb/bdpp/hadoop/yarn-site.xml
例
コンテナが中間ファイルを格納するディレクトリを/disk1/yarn/local、/disk2/yarn/localとする場合の例:
<property> <name>yarn.nodemanager.local-dirs</name> <value>/disk1/yarn/local,/disk2/yarn/local</value> </property>