SSブログ

Talend Open Studio (ETLツール) でデータ統合(2) [BI]

○文字コード指定とか日本語使用の範囲とか

なんかしばらく文字コード問題を忘れていたんですが、今回処理しようとする元データが機種依存文字を使いまくっていたりするので、ケアが必要です…。

まずファイルを開いて文字コード変換だけかけたい場合はtChangeFileEncodingというコンポーネントを使用します。(株)の機種依存文字がある場合SJISではなくWindows-31Jを指定するらしーです。OutputではUTF-8に変更します。
http://www.atmarkit.co.jp/fjava/rensai3/mojibake02/mojibake02.html

tFileInputDelimited のスキーマを作成してみましたが、Column名には日本語が使用できないようです。これは最終的にDBに吐き出す時のスキーマで日本語に変える設定をしておけば良いのでとりあえずここは英文字でいくと良いです。
タグ:TOS ETL Talend
nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:パソコン・インターネット

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

Talend Open Studio (..Talend Open Studio (.. ブログトップ

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。