ファイル編成が行順ファイルの場合、文字コードを指定する必要があります。文字コードの指定内容は以下のとおりです。
設定内容 | 設定名 | 設定値 | 備考 |
---|---|---|---|
Hadoop入力データファイルの文字コード | extjoiner.input.nn.codeset | UTF-8 UTF-16LE UTF-16BE UTF-32LE UTF-32BE | 省略可 デフォルトはUTF-8です
|
Hadoop出力データファイルの文字コード | extjoiner.output.nn.codeset | ||
Map出力データファイルの文字コード | extjoiner.map.output.nn.codeset | ||
Reduce入力データファイルの文字コード | extjoiner.reduce.input.nn.codeset |
参考
行順ファイル編成以外に対する文字コードの指定は無視されます。