ETL変換及び検証ルールの定義

ETL機能を使用すると、データ変換及び検証ルールをデータリーダープロトコルに追加出来ます。

 

受信するデータのデータフローでは、まずデータリーダープロトコルを通して様々なデータソースからデータが取得され、そのデータに特定の検証及び変換式(ETLルール)が適用されます。その後、データがBOARDエンティティ及びキューブにロードされます。

 

 

ETLに定義された式及び検証ルールは、受信するデータのレコードごとに計算されます。ETL式では、レコードの任意のフィールドを参照出来ます。変換されたレコード、すなわち計算結果が出力ETLです。この出力がBOARDデータベースに実際にロードされるデータになります。

 

データリーダープロトコルにETLルールセットを定義するには、プロトコル行の[ETL]アイコンをクリックします。プロトコルにETLを設定するには、最初にプロトコルを作成しておく必要があることに注意してください。

 

ETL定義ウィンドウはスプレッドシートのような環境です。

 

リーダープロトコルのインフォキューブとエンティティが列A及びB([タイプ]及び[フィールド])に表示されます。ETL入力(列Cに表示)はソースシステム(ASCIIファイル又はODBCデータソース)から着信する外部データです。列Dに表示されるETL出力は変換後(式の適用後)のデータで、エンティティ及びインフォキューブにフィードするために使用されます。

ETLがテキストファイルプロトコルに関連付けられている場合、[ファイルリストを更新(Refresh file list)]ボタンをクリックし、ドロップダウンリストから目的のファイルを選択します。ETLがOLE DBプロトコルに関連付けられている場合は、[接続]ボタンをクリックします。

この操作を行うと、ソースファイル又はソーステーブルの最初のレコードが[入力(Input)]列に表示されます。前/次アイコン(左及び右矢印)を使用して、最初の200個のレコードをスクロール出来ます。

[式を表示]ボタンをクリックし、[出力(Output)]列(列D)に、スプレッドシート式の一般的な構文を使用して目的の式を入力します。デフォルトでは変換は定義されていないため、[出力(Output)]列の各セルは、対応する[入力(Input)]列のセルと同じになります。列EGは、中間計算を書き込むために使用出来ます。これにより、複雑で長い式の定義を単純化することが出来ます。プレビューモードに戻るには、[式を表示]ボタンを再度クリックします。

 

セルD1には、レコード検証式を定義出来ます。この式の結果が1(True)の場合、レコードが検証され、BOARDデータベースにフィードされます。式の結果が0(False)の場合、レコードは破棄されます。式では、列CGの任意のセルを参照出来ます。

 

上記の例で定義されている式は、一般的なスプレッドシート式です。各フィールドの式を編集又は表示するには、[式を表示]ボタンをクリックします。