インフォマティカのBig Data Solution 最新製品ラインナップのご紹介

今回は、インフォマティカ のBig Data Solutionの製品ラインナップについて解説致します。
インフォマティカはビッグデータやデータレイク、セルフサービスBIを活用するためのマネージメント製品を提供しています。

製品の提供エリアは、下記の図における色が付いている部分です。
大きく分けるとデータガバナンス部分(黄色)、データ連携部分(青と赤)の2つに分かれ、データレイクの活用を支援します。

具体的な製品名をマッピングしたのが下記の図です。

 

では、それぞれの製品で具体的にどのような事が出来るのか見ていきましょう。

  • Enterprise Information Catalog(EIC)

データ・カタログの作成とその検索・閲覧機能を提供し、データレイクやBIなどのオブジェクト群の見える化を行います。
データの出所を明らかにし、そのデータの流れを確認できることでデータの正確性が把握でき、効果的なデータ分析に繋がります。
詳しくはこちらのブログでご覧下さい。

 

データを活用する前に、ユーザー自身がデータの確認・抽出と簡単な加工を行えるデータプレパレーション機能を提供します。
業務ユーザーはIT部門を介さずに、直接データにアクセス・活用できるようになり、分析の速度が格段に向上します。
詳しくはこちらのブログをご覧下さい。

 

各種データソースからデータを取得し変換するETL機能および、その開発環境を提供します。
Hadoop特有のプログラミングを行うことなく、データ活用を可能にします。
PowerCenterに比べてHadoopや非構造データへ幅広く対応しています。

 

  • Big Data Quality

クレンジングや名寄せなどのデータ品質を向上させる機能や、データの中身を明らかにするプロファイリング機能をHadoopや非構造化データに適用することができます。
複雑なデータ連携の過程を経ると、重複データや欠損データが発生し、データ品質を落としがちですが、それらを未然に防ぎます。

 

  • Big Data Masking

Hadoopや非構造化データに対し、数多く用意された マスキング手法とアルゴリズムによるマスキングを実現します。これにより、複雑なデータ連携の過程でもセキュリティを担保しつつ、効果的で自由なデータ活用を促進します。

 

  • Informatica Intelligent Streaming (IIS)

バッチで連携するETL処理に加え、Spark Streamingを利用したリアルタイム制御処理を追加し、実装できるようにしています。これにより日/時間単位のデータ連携だけでなく、分/秒単位のリアルタイム分析もカバーできます。
またETL処理と同様にGUIの開発環境でノンプログラミングで実現します。

 

以上のように、インフォマティカはデータベースやデータウェアハウスに対するデータマネージメント・ソリューションをHadoopやBIに範囲を広げ、トータルソリューションとして、幅広く提供していきます。HadoopやBIの高度化にぜひ、ご活用下さい。

コメント