インフォマティカの「マーケティングデータレイク」に関する10の質問

マーケティングデータレイク
マーケティングデータレイク

こんにちは。インフォマティカ編集部です。我々インフォマティカでは、様々なソリューションやお客様の事例をWebinarで定期的にご紹介しています。2月にインフォマティカの マーケティングデータレイク に関するWebinarを開催したところ、非常に好評で多くのお客様からご質問をいただきました。今回はその中から、皆様の関心が高く、ご質問の多かった10個ご紹介いたします。

 

先日開催したインフォマティカのマーケティングデータレイク(以下、MDL)に関するWebinarでは、700人以上のお客様にご参加いただきました。このWebinarでは、参加いただくお客様に、より深くインフォマティカのMDLソリューションをご理解いただくことを目的として技術的なデモも行ったため、最終的に1時間の枠内では皆さんの質問にお答えすることが出来ませんでした。

Webinar終了後100以上の質問を頂き、それらの内容を確認していると多くは似た質問であることに気がつきました。そこで、皆さんにとって一番有益になると考えるTOP10の質問に、このブログの中でお答えしていきたいと思います。もし2/2に開催したWebinarに参加されていない方は是非こちら(英語)からご確認ください。プレゼン資料とデータレイクのアーキテクチャに関する資料はWebinarのAttachmentセクションから入手いただけます。

 

それでは、以下より皆さまから頂戴した10の質問に答えていきます。是非追加の質問等ありましたら、このブログのコメント欄に残してくださいね!

 

  1. マーケティングデータレイクで既存のデータウェアハウスを補完することが可能か?

可能です。昔ならではのデータストレージや処理基盤であるデータベースやデータウェアハウス(Teradata、Netezza, Greenplum等)はHadoopやNoSQLで補えます。ほとんどのお客様は昔からあるデータウェアハウスを残し、必要な時に必要なデータを抽出してMDLに流し込めるよう構築しています。

 

  1. ウェブサイトに訪れる“不明の訪問者”を特定することは可能か?

例えば新しいIPアドレスを使い、ブラウザのクッキーが削除されている訪問者等に関しては特定できないケースもあります。しかし、過去にサイトを訪れ、ドキュメントの入手等で情報を入力いただいた方々に関しては基本的に特定する事ができ、行動分析に繋げることができます。もしAdobe AnalyticsかGoogle Analyticsを利用されているようであれば、Cookie IDを使ってMarketo等で訪問者をより深く理解することが出来ます。

 

  1. Oracleなどの既存データソースからデータリネージを確認することが出来るか?

Informatica Intelligent Data Lake(以下、IDL)が持つメタデータ管理機能では、RDBSや各種BIツール、HiveやHDFS、S3、Redshift等のメタデータカタログを保持しています。今後更に多くのシステムを追加していく予定です。

 

  1. MDLとIDLは別物ですか?

MDLとはインフォマティカのビッグデータソリューションを使って、特定のマーケティング分析に関する課題を解決する縦断的ソリューションのことであり、お客様の目的を満たし、また直接的な価値を得ていただけるよう支援します。IDLは、分析のためにデータを検索、準備、管理する機能を提供する製品名であり、ビジネスユーザーが自らマーケティング分析を行えるセルフサービス機能を備えています。

 

  1. 関連相関図で紹介した“ユーザー”とは何ですか?実際にデータにアクセスしてきた人達をユーザーと呼んでいますか?

データ資産に何らかの形で関連している人たちを指します。IDLの中で作られた可能性もありますが、必ずしもデータにアクセスしてきた人たちを指しているわけではありません。

 

  1. インフォマティカの提供するデータのマッチングやクレンジング機能をデータレイク(Hadoop等)で利用することはできますか?

可能です。Informatica MDM- Relate 360(Big Data Relationship Management)はHadoop上に構築することができ、重複データのマッチング等の実行を可能とします。顧客データを正確で唯一の情報とし管理でき、また関連性等をグラフィカルに可視化する機能を持ち合わせています。

 

  1. どのタイミングでデータマスキングが必要となりますか?

データマスキングは基本的にデータ連携を行うタイミングで実施される事が多いです。Big Data Managementでは、様々なデータマスキング機能を持ち合わせており、外部の担当者やアプリケーションユーザー、権限が制限されているビジネスユーザーがデータを利用する際に、マスキングをした上でデータを提供するよう設定し実行することが可能です。

 

  1. データレイクから配信したデータを誰が見れるか等はコントロール可能ですか?

配信したデータのアクセスに関してはHadoopレベルで管理されているため、どこに配信するかをまずは確かめ、Hadoop管理者が権限を持ったユーザーのみにアクセスできるよう設定する必要があります。

 

  1. IDLを使って、どうデータプレパレーションを行えるのですか?

IDL上では、アプリケーション内でのデータのやり取りを“レシピ”として管理します。データを配信する際にはSparkやInformatica Blaze、MapReduce等でサポートされているいずれかの処理エンジンで動く様、このレシピがインフォマティカのBig data managementマッピングを生成します。

 

  1. ビッグデータの領域でインフォマティカはどう見られているのですか?

最近では評価機関のForresterにてビッグデータ領域でインフォマティカがリーダーに位置づけられました。他のトップベンダーについてもご興味がある方はこちらをご確認ください。

 

インフォマティカのビッグデータマネージメントソリューションにご興味がある方は、是非こちらまでお問合せ下さい!また今回ご紹介したWebinar(英語版)はいつでもご覧いただけますので、まだご覧になられていない方はそちらも是非ご確認ください。

 


※本ページの内容は2017年2月10日更新のUS Blog の抄訳です。

10 Customer Questions About Informatica’s Marketing Data Lake

著者:ビッグデータソリューションエキスパート Amit Kara