PowerCenterシリーズ:付加価値機能の活用と拡張 (1)

PowerCenterシリーズ第4回目は、PowerCenterの付加価値機能についてです。私が担当したテーブルでは、PowerCenterの付加価値機能の活用として、データの「プロファイリング」をテーマにディスカッションを行いました。

データ移行や連携のプロジェクトでプロファイリングを必ず実施しているという方や、今後利用を検討している方など、様々なお客様の生の声をお届けします。

 

プロファイリング機能のご紹介

ディスカッションに入る前に、弊社からPowerCenterで利用できるプロファイリング機能をご紹介しました。

%e3%82%b9%e3%83%a9%e3%82%a4%e3%83%891
PowerCenter でご利用いただけるプロファイリング機能

 

PowerCenterの関連製品であるData Qualityでは、以下のようなより高度なプロファイリング機能を提供しています。

%e3%82%b9%e3%83%a9%e3%82%a4%e3%83%894
Data Quality でご利用いただけるプロファイリング機能

 

プロファイリングの必要性:なぜプロファイリングを行うのか

あるお客様からは、「システム統合の際にホストに想定外のデータが格納されており、分析が必要だった。仕様上は特定の数値や日付しか入らないカラムなのに、プロファイリングしてみるとNULLや他の文字が入っていた。」とのお話をいただきました。今ではデータ連携を行う際には必ずプロファイリングを実施し、アプリケーション担当者と一緒に確認されているそうです。

他のお客様からは、「データ連携の際に思わぬエラーが発生したり、データの不整合が発生した。事前にどのようなデータがあるか確認することは大切である。」とのコメントもありました。

プロファイリングを行ってデータの品質を把握・評価することは、プロジェクトの信頼性向上や手戻り軽減のためにも重要であるとの認識を共有することができました。

 

セキュリティ上の問題は?

「プロファイリングすると実データを参照できてしまうが、セキュリティ的に問題ないのか」とのご質問がありました。
今回参加されたお客様は、個人情報や機密データに対してではなくノンセキュアなデータのみプロファイリングを実施されていたり、物理的なセキュリティが整備された専用ルームでのみ実データにアクセスできるようにして管理されたそうです。

関連して、テストデータを作成するのに苦労しているというお客様も多くおられました。実データからかけ離れたデータではテスト品質が低下するため、PowerCenterを活用して有効なデータを作れないかとのご相談をいただきました。
Test Data Managementを使うと、データのマスキングやサブセットを作成することができます。どこにどんなデータがあるかを正確に把握できていなければ、適切なテストデータを作成することはできません。テストデータを作成する場合にも、プロファイリングは重要な役割を果たします。

img005
Test Data Management

 

プロファイリングの活用シーン

システム移行時など一時的にプロファイリングを利用するのではなく、日々利用されているとのお声もありました。

「社内の共通データベースに様々なデータが格納されているため、データやテーブル間のリレーションなどを分析して利用者が使いやすくしている。」
PowerCenterだけではなく、Data Qualityを用いた高度なプロファイリング機能を活用されており、社内でのノウハウも蓄積されてきているとのことです。

 

まとめ

プロファイリングを利用されているお客様から、実運用での使い方などをお話しいただいたことでディスカッションが盛り上がりました。
また、これから実践されようとしているお客様も必要性や今後の検討事項などを確認することができ、非常に有意義だったとのコメントをいただけました。

弊社もプロファイリングやマスキングなどの関連機能を、より多くのお客様にお使いいただけるよう取り組んで参ります。

 


PowerCenterシリーズ:開発How to (1)

PowerCenterシリーズ:開発How to (2)

PowerCenterシリーズ:運用保守How To

PowerCenterシリーズ:組織設計・運用How to

PowerCenterシリーズ:付加価値機能の活用と拡張 (1)

PowerCenterシリーズ:付加価値機能の活用と拡張 (2)