まずは、ジョブ実行ユーザーのユーザーアカウントの作成を行います。
ユーザーアカウントは、HDFS を構成する全ノードに対して作成する必要があります。その際、ユーザー名、ユーザーIDは全ノード間で統一してください。これは、HDFS ではユーザー ID による制御となり、Hadoop ではユーザー名ベースで動作するために、全ノードで整合性がとれるようにするためです。
また、作成するユーザーアカウントが属するグループは、構成ファイル bdpp.conf の BDPP_HADOOP_DEFAULT_GROUP パラメーターで指定したグループを設定してください。
例
ユーザーアカウント“bdppuser1”を作成する場合
以下の条件で作成することとします。
ユーザー名:bdppuser1
ユーザー ID :1500
グループ名:bdppgroup (BDPP_HADOOP_DEFAULT_GROUP パラメーターに指定されているグループ)
# /usr/sbin/useradd -u 1500 -g bdppgroup bdppuser1 <Enter>
作成するユーザーアカウントが属するグループとして、構成ファイル bdpp.conf の BDPP_HADOOP_DEFAULT_GROUP パラメーターで指定したグループ以外のグループを指定する場合は、対象のグループ名、グループIDが全ノード間で統一されている必要があります。
また、/etc/security/limits.confファイルに以下の設定を追記して、対象グループの起動できるプロセス数とファイルディスクリプタの上限値を設定してください。
@{対象グループ名} - nofile 32768 @{対象グループ名} - nproc 32000
例
作成するユーザーアカウントが属するグループを“bdppgroup2”とする場合
ファイルディスクリプタ上限:32768
起動プロセス数上限:32000
# cat /etc/security/limits.conf <Enter> ・・・ 中略 ・・・ @bdppgroup2 - nofile 32768 ← 追加した設定 @bdppgroup2 - nproc 32000 ← 追加した設定