ページの先頭行へ戻る
Big Data Integration ServerV1.1.0 利用ガイド
FUJITSU Software

5.2.1 マスタサーバのセットアップ

マスタサーバでのセットアップ作業について説明します。

5.2.1.1 スレーブサーバ定義ファイルslavesの作成

接続対象となるスレーブサーバをマスタサーバ上のスレーブサーバ定義ファイル /etc/opt/FJSVbsb/bdpp/conf/slaves を新規作成して定義します。

  1. マスタサーバ(プライマリ)上でスレーブサーバ定義ファイルを作成します。

    5台のスレーブサーバ slave1、slave2、slave3、slave4、slave5 を定義する場合

    # cat /etc/opt/FJSVbsb/bdpp/conf/slaves <Enter>
    slave1,slave2,slave3,slave4,slave5
  2. 作成したスレーブ定義ファイルをマスタサーバ(セカンダリ)に転送します。

    マスタサーバ(セカンダリ)のホスト名がmaster2の場合

    # scp -p /etc/opt/FJSVbsb/bdpp/conf/slaves master2:/etc/opt/FJSVbsb/bdpp/conf/. <Enter>

参照

スレーブサーバ定義ファイル slaves の詳細については、“C.2 slaves”を参照してください。


5.2.1.2 構成ファイルbdpp.confの作成

以下に格納されているサンプルファイルを/etc/opt/FJSVbsb/bdpp/conf/bdpp.confとして複写して、編集します。

/etc/opt/FJSVbsb/bdpp/conf/bdpp.conf.sample

設定例は、“マスタサーバの定義例”を参照してください。

構成ファイル bdpp.conf はマスタサーバ(プライマリ)およびマスタサーバ(セカンダリ)で共通の設定である必要があります。マスタサーバ(セカンダリ)のセットアップを行う前に、マスタサーバ(プライマリ)で使用した構成ファイル bdpp.conf をマスタサーバ(セカンダリ)にも複写してください。

構成ファイル bdpp.conf を /etc/opt/FJSVbsb/bdpp/conf ディレクトリ配下で作成し、マスタサーバ(セカンダリ)のホスト名がmaster2の場合

# cd /etc/opt/FJSVbsb/bdpp/conf/  <Enter>
# scp -p ./bdpp.conf root@master2:/etc/opt/FJSVbsb/bdpp/conf/bdpp.conf <Enter>

参照

構成ファイル bdpp.conf の詳細については、“C.1 bdpp.conf”の“C.1.1 マスタサーバ”を参照してください。

5.2.1.3 構成ファイル bdpp.confに記載したユーザーとグループの作成および設定

BDPP_HADOOP_DEFAULT_GROUPに設定したグループの作成、BDPP_HADOOP_DEFAULT_USERSに設定したユーザーの作成および設定を実施します。

マスタサーバ(プライマリ)、マスタサーバ(セカンダリ)に対して、以下を実行してください。

  1. BDPP_HADOOP_DEFAULT_GROUPに設定したグループを作成します。

    以下を実行してBDPP_HADOOP_DEFAULT_GROUPに設定したグループを作成してください。

    BDPP_HADOOP_DEFAULT_GROUPにbdppgroup,1500を設定した場合

    # /usr/sbin/groupadd -g 1500 bdppgroup <Enter>
  2. BDPP_HADOOP_DEFAULT_USERSに設定したユーザーを作成します。

    以下を実行してBDPP_HADOOP_DEFAULT_USERSに設定したユーザーを追加、およびパスワードを設定してください。パスワードは任意です。

    BDPP_HADOOP_DEFAULT_USERSにbdppuser1,1500を設定した場合

    # /usr/sbin/useradd -u 1500 -g bdppgroup bdppuser1 <Enter>
    # passwd bdppuser1 <Enter>
  3. ユーザープロファイルへの追加

    環境変数を設定するために2.で作成したユーザーのユーザープロファイルにスクリプトの実行を追加します。

    ユーザープロファイルの格納先はデフォルトで/home/{ユーザーID}/.bash_profileです。格納先を変更した場合は該当ファイルを修正してください。

    上記のファイルに、“ . /etc/opt/FJSVbsb/bdpp/conf/bdpp-products-env.sh”を追加します。

    BDPP_HADOOP_DEFAULT_USERSにbdppuser1,1500を設定した場合

    ユーザープロファイルの格納先のデフォルトは、/home/bdppuser1/.bash_profile です。

    以下の例のように編集します。

    # Get the aliases and functions
    if [ -f ~/.bashrc ]; then
            . ~/.bashrc
    fi
    
    # User specific environment and startup programs
    
    PATH=$PATH:$HOME/.local/bin:$HOME/bin
    
    export PATH
    
    if [ -f /etc/opt/FJSVbsb/bdpp/conf/bdpp-products-env.sh ]; then
    . /etc/opt/FJSVbsb/bdpp/conf/bdpp-products-env.sh

    fi

5.2.1.4 hdfsユーザーの作成と設定

hdfsユーザーの作成と設定を実施します。

マスタサーバ(プライマリ)、マスタサーバ(セカンダリ)に対して、以下を実行してください。

  1. hdfsユーザーを作成します。

    以下を実行してhdfsユーザーを追加、およびパスワードを設定してください。hadoopグループはインストール時に作成されています。パスワードは任意です。

    # useradd -u 201 -g hadoop hdfs <Enter>
    # passwd hdfs <Enter>
  2. ユーザープロファイルへの追加

    環境変数を設定するためにhdfsユーザーのユーザープロファイルにスクリプトの実行を追加します。

    ユーザープロファイルの格納先はデフォルトで/home/hdfs/.bash_profileです。格納先を変更した場合は該当ファイルを修正してください。

    上記のファイルに、“ . /etc/opt/FJSVbsb/bdpp/conf/bdpp-products-env.sh”を追加します。

    以下の例のように編集します。

    # Get the aliases and functions
    if [ -f ~/.bashrc ]; then
            . ~/.bashrc
    fi
    
    # User specific environment and startup programs
    
    PATH=$PATH:$HOME/.local/bin:$HOME/bin
    
    export PATH
    
    if [ -f /etc/opt/FJSVbsb/bdpp/conf/bdpp-products-env.sh ]; then
    . /etc/opt/FJSVbsb/bdpp/conf/bdpp-products-env.sh

    fi

5.2.1.5 yarnユーザーの設定

yarnユーザーの設定を実施します。yarnユーザーはインストール時に作成されています。

マスタサーバ(プライマリ)、マスタサーバ(セカンダリ)に対して、以下を実行してください。

  1. yarnユーザーのパスワードを設定します。

    以下を実行してyarnユーザーのパスワードを設定してください。
    パスワードは任意です。

    # passwd yarn <Enter>
  2. ユーザープロファイルへの追加

    環境変数を設定するためにyarnユーザーのユーザープロファイルにスクリプトの実行を追加します。
    ユーザープロファイルの格納先はデフォルトで/home/yarn/.bash_profileです。格納先を変更した場合は該当ファイルを修正してください。
    上記のファイルに、“ . /etc/opt/FJSVbsb/bdpp/conf/bdpp-products-env.sh”を追加します。

    以下の例のように編集します。

    # Get the aliases and functions
    if [ -f ~/.bashrc ]; then
            . ~/.bashrc
    fi
    
    # User specific environment and startup programs
    
    PATH=$PATH:$HOME/.local/bin:$HOME/bin
    
    export PATH
    
    if [ -f /etc/opt/FJSVbsb/bdpp/conf/bdpp-products-env.sh ]; then
    . /etc/opt/FJSVbsb/bdpp/conf/bdpp-products-env.sh

    fi

5.2.1.6 Apache Hadoop のセットアップの実行

Apache Hadoop のセットアップを実施します。

マスタサーバ(プライマリ)、マスタサーバ(セカンダリ)に対して、以下を実行してください。

  1. 環境変数 JAVA_HOME を設定します。

    環境変数 JAVA_HOME に Java Runtime Environment 8 をインストールしたディレクトリを設定します。

    Java Runtime Environment 8 のインストールパスが /usr/lib/jre8 ディレクトリの場合

    # export JAVA_HOME=/usr/lib/jre8 <Enter>
  2. セットアップスクリプトを実行します。

以下のとおり、hadoop_setup.sh を実行してください。

# /opt/FJSVbsb/bdpp/common/scripts/setup/hadoop_setup.sh Master <Enter>

注意

セットアップに失敗した場合は、出力されたメッセージの意味や対処方法を参考にして、または、必要に応じてセットアップログ(/var/opt/FJSVbsb/bdpp/log/bdpp_setup.log)を参照して、失敗した原因を取り除き、再度インストールを実施してください。

参考

Apache Hadoop のセットアップによって、本機能のデフォルトの設定として Hadoop および HDFS の構成が設定されます。構成設定をチューニングするには、“分散処理編 ユーザーズガイド”を参照してください。

5.2.1.7 Apache ZooKeeperのセットアップの実行

Apache ZooKeeperのセットアップを実施します

マスタサーバ(プライマリ)、マスタサーバ(セカンダリ)に対して、以下を実行してください。

  1. zookeeperユーザーを作成します。

    以下を実行してzookeeperユーザーを追加してください。hadoopグループはインストール時に作成されています。

    # useradd -u 205 -g hadoop zookeeper <Enter>
  2. ユーザープロファイルへの追加

    環境変数を設定するためにzookeeperユーザーのユーザープロファイルにスクリプトの実行を追加します。
    ユーザープロファイルの格納先はデフォルトで/home/zookeeper/.bash_profileです。格納先を変更した場合は該当ファイルを修正してください。
    上記のファイルに、“ . /etc/opt/FJSVbsb/bdpp/conf/bdpp-products-env.sh”を追加します。

    以下の例のように編集します。

    # Get the aliases and functions
    if [ -f ~/.bashrc ]; then
            . ~/.bashrc
    fi
    
    # User specific environment and startup programs
    
    PATH=$PATH:$HOME/.local/bin:$HOME/bin
    
    export PATH
    
    if [ -f /etc/opt/FJSVbsb/bdpp/conf/bdpp-products-env.sh ]; then
    . /etc/opt/FJSVbsb/bdpp/conf/bdpp-products-env.sh

    fi
  3. zoo.cfgを編集します。

    サンプルのzoo_sample.cfgをzoo.cfgというファイル名に複写します。

    # cd /etc/opt/FJSVbsb/bdpp/zookeeper <Enter>
    # cp -p zoo_sample.cfg zoo.cfg <Enter>

    zoo.cfgを以下の例のように編集します。

    dataDirパラメーター設定値を以下に修正してください。

    • dataDir=/var/opt/FJSVbsb/bdpp/zookeeper

    ZKクラスタのパラメーター定義を以下の例に従って追加定義してください。

    下記、修正例に記載しているmaster1master2developはマスタサーバ(プライマリ)、マスタサーバ(セカンダリ)、開発実行環境サーバのホスト名です。“4.1.2.5 ホスト名の設定”で設定した各サーバのホスト名に修正してください。

    • master1:マスタサーバ(プライマリ)ホスト名

    • master2:マスタサーバ(セカンダリ)ホスト名

    • develop:開発実行環境サーバホスト名

    dataDir=/var/opt/FJSVbsb/bdpp/zookeeper
    
    server.1=master1:2888:3888
    server.2=master2:2888:3888
    server.3=develop:2888:3888
  4. zookeeper-env.shを作成します。

    以下を実行し、zookeeper-env.shファイルを作成します。

    # echo "export ZOO_LOG_DIR=/var/opt/FJSVbsb/bdpp/log/zookeeper" > /etc/opt/FJSVbsb/bdpp/zookeeper/zookeeper-env.sh <Enter>
  5. log4j.propertiesを修正します。

    以下に格納されているlog4j.propertiesを修正します。

    • 格納先:/etc/opt/FJSVbsb/bdpp/zookeeper/log4j.properties

    以下に記載するパラメーターを修正してください。

    対象パラメーター

    zookeeper.log.dir

    修正内容

    設定値を“/var/opt/FJSVbsb/bdpp/log/zookeeper”に修正します。

    修正前

    zookeeper.log.dir=.

    修正後

    zookeeper.log.dir=/var/opt/FJSVbsb/bdpp/log/zookeeper
  6. ログ格納ディレクトリを作成します。

    以下を実行し、ログ格納ディレクトリを作成します。

    # mkdir -p /var/opt/FJSVbsb/bdpp/log/zookeeper <Enter>
    # chown zookeeper:hadoop /var/opt/FJSVbsb/bdpp/log/zookeeper <Enter>
  7. myidを設定します。

    マスタサーバ別に以下を実行し、myidを設定してください。

    マスタサーバ(プライマリ)の場合

    # mkdir -p /var/opt/FJSVbsb/bdpp/zookeeper <Enter>
    # echo "1" > /var/opt/FJSVbsb/bdpp/zookeeper/myid <Enter>
    # chown -R zookeeper:hadoop /var/opt/FJSVbsb/bdpp/zookeeper <Enter>

    マスタサーバ(セカンダリ)の場合

    # mkdir -p /var/opt/FJSVbsb/bdpp/zookeeper <Enter>
    # echo "2" > /var/opt/FJSVbsb/bdpp/zookeeper/myid <Enter>
    # chown -R zookeeper:hadoop /var/opt/FJSVbsb/bdpp/zookeeper <Enter>

5.2.1.8 Hadoop設定ファイルの修正

以下のHadoop設定ファイルを修正します。

マスタサーバ(プライマリ)に対して、以下を実行してください。

作成後、“5.2.1.8.7 修正ファイルの転送”でマスタサーバ(セカンダリ)に転送します。

5.2.1.8.1 core-site.xmlの修正

以下に格納されているcore-site.xmlを修正します。

格納先:/etc/opt/FJSVbsb/bdpp/hadoop/core-site.xml

以下に記載するパラメーターを修正してください。

対象パラメーター

fs.defaultFS

修正内容

value値から“:8020”という記述を削除します。

下記、修正例に記載しているclusterはセットアップ時に指定したbdpp.confの以下の設定値が反映されています。実際の設定値に合わせて読み替えてください。

cluster:二重化構成ネームサービス名(bdpp.confの“BDPP_CLUSTER_NAME”設定値)

修正前

<property>
<name>fs.defaultFS</name>
<value>hdfs://cluster:8020</value>
</property>

修正後

<property>
<name>fs.defaultFS</name>
<value>hdfs://cluster</value>
</property>
対象パラメーター

fs.hdfs.impl、fs.AbstractFileSystem.pdfs.impl、fs.AbstractFileSystem.hdfs.impl

修正内容

対象パラメーターの設定定義をコメントアウトしてください。

修正前

<property>
<name>fs.hdfs.impl</name>
<value>com.fujitsu.pdfs.fs.PdfsDirectHFS</value>
</property>
<property>
<name>fs.AbstractFileSystem.pdfs.impl</name>
<value>com.fujitsu.pdfs.fs.PdfsDirectFs</value>
</property>
<property>
<name>fs.AbstractFileSystem.hdfs.impl</name>
<value>com.fujitsu.pdfs.fs.PdfsDirectFs</value>
</property>

修正後

<!--
<property>
<name>fs.hdfs.impl</name>
<value>com.fujitsu.pdfs.fs.PdfsDirectHFS</value>
</property>
<property>
<name>fs.AbstractFileSystem.pdfs.impl</name>
<value>com.fujitsu.pdfs.fs.PdfsDirectFs</value>
</property>
<property>
<name>fs.AbstractFileSystem.hdfs.impl</name>
<value>com.fujitsu.pdfs.fs.PdfsDirectFs</value>
</property>
-->

また、以下のパラメーターを追加してください。

下記、修正例に記載しているmaster1master2developはマスタサーバ(プライマリ)、マスタサーバ(セカンダリ)、開発実行環境サーバのホスト名です。“4.1.2.5 ホスト名の設定”で設定した各サーバのホスト名に修正してください。

  • master1:マスタサーバ(プライマリ)ホスト名

  • master2:マスタサーバ(セカンダリ)ホスト名

  • develop:開発実行環境サーバホスト名

<property>
  <name>ha.zookeeper.quorum</name>
  <value>master1:2181,master2:2181,develop:2181</value>
</property>
5.2.1.8.2 hdfs-site.xmlの修正

以下に格納されているhdfs-site.xmlを修正します。

格納先

/etc/opt/FJSVbsb/bdpp/hadoop/hdfs-site.xml

以下に記載するパラメーターを修正してください。

対象パラメーター

dfs.http.address

修正内容

value値を“0.0.0.0:50070”に修正します。

下記、修正例に記載しているclusterはセットアップ時に指定したbdpp.confの以下の設定値が反映されています。実際の設定値に合わせて読み替えてください。

cluster:二重化構成ネームサービス名(bdpp.confの“BDPP_CLUSTER_NAME”設定値)

修正前

<property>
<name>dfs.http.address</name>
<value>cluster:50070</value>
literal string "local" or a host:port for NDFS.
</description>
<final>true</final>
</property>

修正後

<property>
<name>dfs.http.address</name>
<value>0.0.0.0:50070</value>
literal string "local" or a host:port for NDFS.
</description>
<final>true</final>
</property>
対象パラメーター

dfs.secondary.http.address

修正内容

value値を“0.0.0.0:50090”に修正します。

下記、修正例に記載しているclusterはセットアップ時に指定したbdpp.confの以下の設定値が反映されています。実際の設定値に合わせて読み替えてください。

cluster:二重化構成ネームサービス名(bdpp.confの“BDPP_CLUSTER_NAME”設定値)

修正前

<property>
<name>dfs.secondary.http.address</name>
<value>cluster:50090</value>
If the port is 0 then the server will start on a free port.
</description>
<final>true</final>
</property>

修正後

<property>
<name>dfs.secondary.http.address</name>
<value>0.0.0.0:50090</value>
If the port is 0 then the server will start on a free port.
</description>
<final>true</final>
</property>

また、以下の各パラメーターを追加してください。

下記、修正例に記載しているclusterはセットアップ時に指定したbdpp.confの以下の設定値が反映されています。実際の設定値に合わせて修正してください。

また、master1master2developはマスタサーバ(プライマリ)、マスタサーバ(セカンダリ)、開発実行環境サーバのホスト名です。“4.1.2.5 ホスト名の設定”で設定した各サーバのホスト名に修正してください。

  • cluster:二重化構成ネームサービス名(bdpp.confの“BDPP_CLUSTER_NAME”設定値)

  • master1:マスタサーバ(プライマリ)ホスト名

  • master2:マスタサーバ(セカンダリ)ホスト名

  • develop:開発実行環境サーバホスト名

<property>
  <name>dfs.nameservices</name>
  <value>cluster</value>
</property>
<property>
  <name>dfs.ha.namenodes.cluster</name>
  <value>nn1,nn2</value>
</property>
<property>
  <name>dfs.namenode.rpc-address.cluster.nn1</name>
  <value>master1:8020</value>
</property>
<property>
  <name>dfs.namenode.rpc-address.cluster.nn2</name>
  <value>master2:8020</value>
</property>
<property>
  <name>dfs.namenode.http-address.cluster.nn1</name>
  <value>master1:50070</value>
</property>
<property>
  <name>dfs.namenode.http-address.cluster.nn2</name>
  <value>master2:50070</value>
</property>
<property>
  <name>dfs.namenode.shared.edits.dir</name>
  <value>qjournal://master1:8485;master2:8485;develop:8485/cluster</value>
</property>
<property>
  <name>dfs.client.failover.proxy.provider.cluster</name>
  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<property>
  <name>dfs.ha.fencing.methods</name>
  <value>shell(/bin/true)</value>
</property>
<property>
  <name>dfs.journalnode.edits.dir</name>
  <value>/var/opt/FJSVbsb/bdpp/hdfs/jn</value>
</property>
<property>
  <name>dfs.ha.automatic-failover.enabled</name>
  <value>true</value>
</property>
<property>
  <name>dfs.support.append</name>
  <value>true</value>
</property>
<property>
  <name>dfs.datanode.balance.bandwidthPerSec</name>
  <value>6250000</value>
</property>
<property>
  <name>dfs.namenode.name.dir.restore</name>
  <value>true</value>
</property>
5.2.1.8.3 yarn-site.xmlの修正

以下に格納されているyarn-site.xmlを修正します。

格納先

/etc/opt/FJSVbsb/bdpp/hadoop/yarn-site.xml

以下に記載するパラメーターを修正してください。

対象パラメーター:yarn.resourcemanager.hostname
修正内容

パラメーターの設定定義をコメントアウトしてください。

下記、修正例に記載しているclusterはセットアップ時に指定したbdpp.confの以下の設定値が反映されています。実際の設定値に合わせて読み替えてください。

cluster:二重化構成ネームサービス名(bdpp.confの“BDPP_CLUSTER_NAME”設定値)

修正前

<property>
<name>yarn.resourcemanager.hostname</name>
<value>cluster</value>
</property>

修正後

<!--
<property>
<name>yarn.resourcemanager.hostname</name>
<value>cluster</value>
</property>
-->
対象パラメーター

yarn.nodemanager.remote-app-log-dir

修正内容

value値から“pdfs://”という記述を削除してください。

修正前

<property>
<name>yarn.nodemanager.remote-app-log-dir</name>
<value>pdfs:///history/done/yarn</value>
</property>

修正後

<property>
<name>yarn.nodemanager.remote-app-log-dir</name>
<value>/history/done/yarn</value>
</property>
対象パラメーター

yarn.log.server.url

修正内容

パラメーターの設定定義をコメントアウトしてください。

下記、修正例に記載しているclusterはセットアップ時に指定したbdpp.confの以下の設定値が反映されています。実際の設定値に合わせて読み替えてください。

cluster:二重化構成ネームサービス名(bdpp.confの“BDPP_CLUSTER_NAME”設定値)

修正前

<property>
<name>yarn.log.server.url</name>
<value>http://cluster:19888/jobhistory/logs</value>
</property>

修正後

<!--
<property>
<name>yarn.log.server.url</name>
<value>http://cluster:19888/jobhistory/logs</value>
</property>
-->

また、以下の各パラメーターを追加してください。

下記、修正例に記載しているclusterはセットアップ時に指定したbdpp.confの以下の設定値が反映されています。実際の設定値に合わせて修正してください。

また、master1master2developはマスタサーバ(プライマリ)、マスタサーバ(セカンダリ)、開発実行環境サーバのホスト名です。“4.1.2.5 ホスト名の設定”で設定した各サーバのホスト名に修正してください。

  • cluster:二重化構成ネームサービス名(bdpp.confの“BDPP_CLUSTER_NAME”設定値)

  • master1:マスタサーバ(プライマリ)ホスト名

  • master2:マスタサーバ(セカンダリ)ホスト名

  • develop:開発実行環境サーバホスト名

<property>
  <name>yarn.resourcemanager.ha.enabled</name>
  <value>true</value>
</property>
<property>
  <name>yarn.resourcemanager.cluster-id</name>
  <value>cluster</value>
</property>
<property>
  <name>yarn.resourcemanager.ha.rm-ids</name>
  <value>rm1,rm2</value>
</property>
<property>
  <name>yarn.resourcemanager.hostname.rm1</name>
  <value>master1</value>
</property>
<property>
  <name>yarn.resourcemanager.hostname.rm2</name>
  <value>master2</value>
</property>
<property>
  <name>yarn.resourcemanager.webapp.address.rm1</name>
  <value>master1:8088</value>
</property>
<property>
  <name>yarn.resourcemanager.webapp.address.rm2</name>
  <value>master2:8088</value>
</property>
<property>
  <name>yarn.resourcemanager.recovery.enabled</name>
  <value>true</value>
</property>
<property>
  <name>yarn.resourcemanager.store.class</name>
  <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value>
</property>
<property>
  <name>yarn.resourcemanager.zk-address</name>
  <value>master1:2181,master2:2181,develop:2181</value>
</property>
<property>
  <name>yarn.resourcemanager.recovery.enabled</name>
  <value>true</value>
</property>
<property>
  <name>yarn.resourcemanager.nodes.include-path</name>
  <value>/etc/opt/FJSVbsb/bdpp/hadoop/yarn.include</value>
</property>
<property>
  <name>yarn.resourcemanager.nodes.exclude-path</name>
  <value>/etc/opt/FJSVbsb/bdpp/hadoop/yarn.exclude</value>
</property>
5.2.1.8.4 mapred-site.xmlの修正

以下に格納されているmapred-site.xmlを修正します。

格納先:/etc/opt/FJSVbsb/bdpp/hadoop/mapred-site.xml

以下に記載するパラメーターを修正してください。

対象パラメーター

mapreduce.jobhistory.address、mapreduce.jobhistory.webapp.address、

mapreduce.jobhistory.webapp.https.address、mapreduce.jobhistory.admin.address

修正内容

各パラメーターの設定定義をコメントアウトしてください。

下記、修正例に記載しているclusterはセットアップ時に指定したbdpp.confの以下の設定値が反映されています。実際の設定値に合わせて読み替えてください。

cluster:二重化構成ネームサービス名(bdpp.confの“BDPP_CLUSTER_NAME”設定値)

修正前

<property>
<name>mapreduce.jobhistory.address</name>
<value>cluster:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>cluster:19888</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.https.address</name>
<value>cluster:19890</value>
</property>
<property>
<name>mapreduce.jobhistory.admin.address</name>
<value>cluster:10033</value>
</property>

修正後

<!--
<property>
<name>mapreduce.jobhistory.address</name>
<value>cluster:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>cluster:19888</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.https.address</name>
<value>cluster:19890</value>
</property>
<property>
<name>mapreduce.jobhistory.admin.address</name>
<value>cluster:10033</value>
</property>
-->
5.2.1.8.5 dfs.includeの修正

接続対象となるスレーブサーバをマスタサーバ上のNameNodeへの接続を許可するスレーブサーバを定義するファイル /etc/opt/FJSVbsb/bdpp/hadoop/dfs.include に定義します。

マスタサーバ(プライマリ)上でスレーブサーバ定義ファイルを作成します。

5台のスレーブサーバ slave1、slave2、slave3、slave4、slave5 を定義する場合

# cat /etc/opt/FJSVbsb/bdpp/hadoop/dfs.include <Enter>
slave1
slave2
slave3
slave4
slave5
5.2.1.8.6 yarn.includeの修正

接続対象となるスレーブサーバをマスタサーバ上のResourceManagerへの接続を許可するスレーブサーバを定義するファイル /etc/opt/FJSVbsb/bdpp/hadoop/yarn.include に定義します。

マスタサーバ(プライマリ)上でスレーブサーバ定義ファイルを作成します。

5台のスレーブサーバ slave1、slave2、slave3、slave4、slave5 を定義する場合

# cat /etc/opt/FJSVbsb/bdpp/hadoop/yarn.include <Enter>
slave1
slave2
slave3
slave4
slave5
5.2.1.8.7 修正ファイルの転送

以下を実行して修正、作成したファイルをマスタサーバ(セカンダリ)に転送します。

マスタサーバ(セカンダリ)のホスト名がmaster2の場合

# scp -p /etc/opt/FJSVbsb/bdpp/hadoop/core-site.xml master2:/etc/opt/FJSVbsb/bdpp/hadoop/. <Enter>
# scp -p /etc/opt/FJSVbsb/bdpp/hadoop/hdfs-site.xml master2:/etc/opt/FJSVbsb/bdpp/hadoop/. <Enter>
# scp -p /etc/opt/FJSVbsb/bdpp/hadoop/yarn-site.xml master2:/etc/opt/FJSVbsb/bdpp/hadoop/. <Enter>
# scp -p /etc/opt/FJSVbsb/bdpp/hadoop/mapred-site.xml master2:/etc/opt/FJSVbsb/bdpp/hadoop/. <Enter>
# scp -p /etc/opt/FJSVbsb/bdpp/hadoop/dfs.include master2:/etc/opt/FJSVbsb/bdpp/hadoop/. <Enter>
# scp -p /etc/opt/FJSVbsb/bdpp/hadoop/yarn.include master2:/etc/opt/FJSVbsb/bdpp/hadoop/. <Enter>

5.2.1.9 Spark設定ファイルの修正

以下のSpark設定ファイルを修正します。

作成後、“5.2.1.9.2 修正ファイルの転送”でマスタサーバ(セカンダリ)に転送します。

5.2.1.9.1 saprk-defaults.confの修正

以下に格納されているspark-defaults.confを修正します。

以下に記載するパラメーターを修正してください。

対象パラメーター

spark.eventLog.dir

修正内容

value値の“pdfs:///history/done/spark”を“hdfs:///history/done/spark”に修正します。

修正前

spark.eventLog.dir               pdfs:///history/done/spark

修正後

spark.eventLog.dir               hdfs:///history/done/spark
対象パラメーター

spark.history.fs.logDirectory

修正内容

value値の“pdfs:///history/done/spark”を“hdfs:///history/done/spark”に修正します。

修正前

spark.history.fs.logDirectory    pdfs:///history/done/spark

修正後

spark.history.fs.logDirectory    hdfs:///history/done/spark
5.2.1.9.2 修正ファイルの転送

以下を実行して修正ファイルをマスタサーバ(セカンダリ)に転送します。

マスタサーバ(セカンダリ)のホスト名がmaster2の場合

# scp -p /etc/opt/FJSVbsb/bdpp/spark/spark-defaults.conf master2:/etc/opt/FJSVbsb/bdpp/spark/. <Enter>