Talend Open Studio (ETLツール) でデータ統合(2) [BI]
○文字コード指定とか日本語使用の範囲とか
なんかしばらく文字コード問題を忘れていたんですが、今回処理しようとする元データが機種依存文字を使いまくっていたりするので、ケアが必要です…。
まずファイルを開いて文字コード変換だけかけたい場合はtChangeFileEncodingというコンポーネントを使用します。(株)の機種依存文字がある場合SJISではなくWindows-31Jを指定するらしーです。OutputではUTF-8に変更します。
http://www.atmarkit.co.jp/fjava/rensai3/mojibake02/mojibake02.html
tFileInputDelimited のスキーマを作成してみましたが、Column名には日本語が使用できないようです。これは最終的にDBに吐き出す時のスキーマで日本語に変える設定をしておけば良いのでとりあえずここは英文字でいくと良いです。
なんかしばらく文字コード問題を忘れていたんですが、今回処理しようとする元データが機種依存文字を使いまくっていたりするので、ケアが必要です…。
まずファイルを開いて文字コード変換だけかけたい場合はtChangeFileEncodingというコンポーネントを使用します。(株)の機種依存文字がある場合SJISではなくWindows-31Jを指定するらしーです。OutputではUTF-8に変更します。
http://www.atmarkit.co.jp/fjava/rensai3/mojibake02/mojibake02.html
tFileInputDelimited のスキーマを作成してみましたが、Column名には日本語が使用できないようです。これは最終的にDBに吐き出す時のスキーマで日本語に変える設定をしておけば良いのでとりあえずここは英文字でいくと良いです。
コメント 0