ページの先頭行へ戻る
Interstage Big DataParallel Processing Server V1.2.2 ユーザーズガイド
FUJITSU Software

I.2.6 設定ファイル

本製品とSparkの連携のために使用する設定ファイルについて説明します。


マスタサーバ(セカンダリ)の設定ファイル

マスタサーバ(セカンダリ)で作成・編集する設定ファイルについて説明します。


spark-env.sh
ファイルの格納場所

{Sparkインストールディレクトリ}/conf

ファイルの概要

Spark で使用する環境変数を定義する設定ファイルです。

環境変数を以下のように設定してください。

環境変数

設定例

説明

SPARK_MASTER_IP

10.10.10.12

マスタサーバ(セカンダリ)の業務LANのIPを指定します。

SPARK_PID_DIR

/var/run/spark

SparkのPIDファイルを格納するディレクトリを指定します。

指定しなかった場合、PIDファイルは/tmp配下に格納されます。/tmp配下のファイルは自動的に削除されることがあるため、/tmp配下以外に格納することを推奨します。

HADOOP_CONF_DIR

/etc/hadoop_spark

Spark用のHadoop設定ファイル(core-site.xml)を格納するディレクトリを指定します。

JAVA_HOME

/usr/lib/jre-fj

Sparkが利用するJVMのパスを指定します。
/usr/lib/jre-fjを指定してください。


core-site.xml
ファイルの格納場所

環境変数HADOOP_CONF_DIRで指定したディレクトリ

ファイルの概要

Hadoop に関する設定ファイルです

プロパティを以下のように設定してください。

プロパティ

設定値/設定例

説明

fs.default.name

file:///

DFSへのアクセスに使用する URI schemeを指定します。

file:///を指定してください。


hive-site.xml
ファイルの格納場所

{Hiveインストールディレクトリ}/conf

ファイルの概要

Hive に関する設定ファイルです。

プロパティを以下のように設定してください。

プロパティ

設定例

説明

javax.jdo.option.ConnectionURL

jdbc:mysql://meta-db-server:3306/metastore_spark

メタストアDBへのJDBC接続URLを指定します。

以下の形式で指定します。
jdbc:{RDBソフトウェア名}://{メタストアDBサーバ名}:{メタストアDBポート番号}/{メタストアDB名}

javax.jdo.option.ConnectionDriverName

com.mysql.jdbc.Driver

メタストアDB接続のJDBCドライバーのクラス名を指定します。

javax.jdo.option.ConnectionUserName

hive

メタストアDBのDBユーザー名を指定します。

javax.jdo.option.ConnectionPassword

hive_password

メタストアDBのDBユーザーのパスワードを指定します。

datanucleus.autoCreateSchema

false

メタストアDBに必要なスキーマの自動作成を行うか指定します。

flaseを指定してください。

datanucleus.autoStartMechanism

SchemaTable

起動時の初期化設定を指定します。

SchemaTableを指定してください。

hive.metastore.warehouse.dir

file:///mnt/pdfs/hadoop/user/hive/warehouse

ネイティブテーブルのデフォルトロケーションを指定します。

指定したディレクトリにデータが格納されます。

「file://{PDFSのマウントポイント}/」から始まる形式でフルパスを指定してください。


スレーブサーバの設定ファイル

スレーブサーバで作成・編集する設定ファイルについて説明します。


spark-env.sh
ファイルの格納場所

{Sparkインストールディレクトリ}/conf

ファイルの概要

Spark で使用する環境変数を定義する設定ファイルです。

環境変数を以下のように設定してください。

環境変数

設定例

説明

SPARK_MASTER_IP

10.10.10.12

<マスタサーバ(セカンダリ)と同じ値を設定します>

SPARK_PID_DIR

/var/run/spark

<マスタサーバ(セカンダリ)と同じ値を設定します>

HADOOP_CONF_DIR

/etc/hadoop_spark

<マスタサーバ(セカンダリ)と同じ値を設定します>

JAVA_HOME

/usr/lib/jre-fj

<マスタサーバ(セカンダリ)と同じ値を設定します>


core-site.xml
ファイルの格納場所

環境変数HADOOP_CONF_DIRで指定したディレクトリ

ファイルの概要

Hadoop に関する設定ファイルです

プロパティを以下のように設定してください。

プロパティ

設定値/設定例

説明

fs.default.name

file:///

<マスタサーバ(セカンダリ)と同じ値を設定します>


開発実行環境サーバの設定ファイル

開発実行環境サーバで作成・編集する設定ファイルについて説明します。


spark-env.sh
ファイルの格納場所

{Sparkインストールディレクトリ}/conf

ファイルの概要

Spark で使用する環境変数を定義する設定ファイルです。

環境変数を以下のように設定してください。

環境変数

設定例

説明

SPARK_MASTER_IP

10.10.10.12

<マスタサーバ(セカンダリ)と同じ値を設定します>

SPARK_PID_DIR

/var/run/spark

<マスタサーバ(セカンダリ)と同じ値を設定します>

HADOOP_CONF_DIR

/etc/hadoop_spark

<マスタサーバ(セカンダリ)と同じ値を設定します>

JAVA_HOME

/usr/lib/jre-fj

<マスタサーバ(セカンダリ)と同じ値を設定します>


core-site.xml
ファイルの格納場所

環境変数HADOOP_CONF_DIRで指定したディレクトリ

ファイルの概要

Hadoop に関する設定ファイルです

プロパティを以下のように設定してください。

プロパティ

設定値/設定例

説明

fs.default.name

file:///

<マスタサーバ(セカンダリ)と同じ値を設定します>


hive-site.xml
ファイルの格納場所

{Sparkインストールディレクトリ}/conf

ファイルの概要

Hive に関する設定ファイルです。

プロパティを以下のように設定してください。

プロパティ

設定例

説明

hive.metastore.uris

thrift://10.10.10.12:9083

Hiveメタストアへの接続URIを指定します。
以下の形式で指定します。

thrift://{マスタサーバ(セカンダリ)の業務LANのIP}:{Hive Metastoreのポート番号}

hive.exec.scratchdir

file:///mnt/pdfs/hadoop/tmp/spark-${user.name}

Spark SQLからクエリを実行する時に使用する一時領域を指定します。
「file://{PDFSのマウントポイント}/」から始まる形式でフルパスを指定してください。