【パートナーブログ:NTT データ】「AI・データ民主化」の第一歩は適切なデータマネジメントから 

「AI・データの民主化」が謳われ始めて数年が経過し、今日では特定の業務部門に留まらず、多種多様な部門・業務における「ビッグデータ」「AI」活用が当たり前の時代になってきたと強く感じます。

加えて、データ活用の目的を業務の改善や高度化に留めず、新たな事業スタイルの創造や変革に定める「DX(デジタルトランスフォーメーション)」への注目も高まっており、多くの企業がAI・データによるビジネス変革に取り組み始めています。

NTTデータでは、かねてより「データマネジメント」「AI」「BI」の領域に意欲的に取り組んできました。

各領域のテクノロジーリーダーであるインフォマティカ、DataRobot、Tableau、Thoughtspotのパートナーとして知見・実績を蓄積すると共に、それらの技術の強みや特徴を引き出し、組み合わせることでお客様のデータ活用ニーズに柔軟かつ最大限に充足するデータ分析基盤をご提供してきましたが、こうした取り組みに加え、この度クラウドデータプラットフォームを提供する”Snowflake”(最後にご紹介します!)のパートナーとなったことにより、「データ蓄積・共有」領域における価値提供力をより一層強化し、幅広いご提案ができるようになりました。

各領域のプロフェッショナルチームにより、AI活用のビジネス目的設計、データサイエンスから、業務適用・人材育成まで、AI・データ活用の全プロセスをサポートいたします。

【図1:各パートナーのコア技術とともに生み出す「AI ・データの民主化」イメージ】

「AI・データの民主化」においては、日々生まれる膨大な量のデータを、専門知識を持つデータサイエンティストだけでなく、より一般のビジネスユーザがデータ分析や意思決定・判断に活用する世界観が標榜されています。

特定の個別部門やIT部門だけでなく、全社として企業内の様々なデータを組み合わせて活用し、データから得たインサイトをビジネスに適用することが求められます。

一方で、全社活用すべく大量のデータを蓄積したものの、「欲しいデータが見つからない」、「一部の有識者にしかデータ活用ができない」などの課題に直面される企業様も多くいらっしゃいます。

「AI」をより効果的に活用するためには、より適切なデータを取捨選択して使う必要があります。

しかし、分析の幅を広げようと、より多くのデータを集めれば集めるほど、分析ユーザが求めるデータを見つけにくくなる、といったジレンマに陥ってしまいがちです。

こういった課題に非常に効果的な製品が、インフォマティカのEDC(Informatica Enterprise Data Catalog)です。EDCはその名の通り”カタログ”として、蓄積されたデータのメタ情報の見える化や、キーワードによる検索機能などを提供し、ユーザの「データ検索・理解」を促します。

また、前述の目的以外にも、データの流れ(データリネージ)の見える化による各システムへの影響把握や、機密データなどの保護すべきデータの所在・状態の把握によるコンプライアンス向上なども実現可能です。

昨今、こういった様々な目的からEDCの導入をご検討されるお客様が非常に増えてきていますが、目的設計が曖昧な状態で導入したせいで、メタデータがきちんと整備されずうまく検索できなかったり、結局業務知識のある一部のユーザにしか使われなかったりと、導入後の利用が定着しなかったケースも存在します。

そこで、このたびNTTデータ AI&IoT事業部では、EDCの導入コンサルから利活用促進までをご支援すべく「データカタログ スタートサービス」を立ち上げました。

本サービスでは、データカタログを導入するステップを下記の3つに定義し、それらを一気通貫でご支援致します。


導入目的の定義

 カタログを効果的にご利用いただくためには、導入前の目的定義が不可欠です。
 ここでは導入前のコンサルティングとして、豊富なユースケースからお客様事例にあった目的定義をサポートいたします。

②カタログ構築

 専門家チームによる確立された構築メソッドを活用します。
 NTTデータでは、データカタログの知見豊富な”インフォマティカ・エバンジェリストチーム”を設置し、他にもHadoop、インフラ専門家を多数有しています。

③カタログの利用・運用

 導入後、データカタログをユーザが使っていくためには、継続的な普及と定着のサポートが不可欠です。
 NTTデータの豊富な実績から、導入後の利活用促進までをご支援致します。

上記の3ステップにより、データカタログ活用を定着させ、企業内の「データ」のさらなる活用と「データ民主化」を促進します。

ここまでは、データ活用における分析の担い手、すなわち“人”に着目し、分析ユーザから簡易・効率的をデータ探索や活用可能とする「データカタログ」についてご紹介してまいりました。ここからは、少し焦点を変え、データ活用における“システム”に着目し、システム間のデータ連携におけるよくある課題とソリューションについて、焦点を当ててみたいと思います。

企業内におけるデータ活用の幅が広がるとともに、システム間のデータ連携数や複雑さが増加し、各データの影響範囲が不明確になりがちであるという課題・お悩みは非常に良くうかがいます。

そういった各システム間のデータ連携のための製品が、インフォマティカのDIH(Informatica Data Integration Hub)です。NTTデータでは、データ連携HUB(DIH)について多くの知見と実績を有しています。

データ連携HUBの役割としては、各システムが個別に行っていたデータ連携をHUBとして中央管理し、システム間連携のスパゲッティ化の解消を促します。それまでピアツーピアで行われていたデータ連携と管理をHUBに集約することで各データの影響範囲などの把握が容易となります。

また多様なシステム(レガシー、クラウドなど)との連携を疎結合化し、それぞれのインタフェース追加・改修などの影響範囲を限定することが可能となります。

NTTデータでは、基幹システムとSAP等のクラウド間連携など多種多様な環境における導入事例や、大量IFの開発など、豊富な知見と実績がございます。

昨年度は大規模案件でのデータ連携HUB導入実績を評価頂き、Informatica Partner Award 2019にて「#1 Partner of the Year」と「#1 Big Deal of the Year」をダブル受賞いたしました。

データ連携HUBにより各部門のデータ連携が活発化していき、最終的に全社活用に向けたDWHへデータ連携・蓄積といった段階的な拡大がなされたとしても、データ連携HUBにて連携先に「全社活用DWH」を追加するというような形で、難関となる各部門からのデータ取集もより容易に実現可能です。

そうして取り扱うデータや利用者の範囲が拡大するにつれ、先に述べたデータカタログのような見える化が必須となってくるのです。

【図2:データ連携HUBソリューション】

最後に、冒頭でご紹介しました通り、私共NTTデータ AI&IoT事業部は、2020年2月にクラウドコンピューティング技術に強みを持つ “Snowflake Inc.”のパートナーとなりました。

Snowflakeはクラウドで利用できるSQLベースのフルマネージドのデータウェアハウスです。

Snowflake社がクラウド上でお客様のデータを管理するため、お客様自身でのストレージ容量の確保やサーバ運用などの煩雑な管理が完全になくなります。

また独自のアーキテクチャによりコンピュートとストレージでリソースを完全に分離しており、ストレージは一元管理している為、データの分散は発生せず、コンピュートは「必要な用途に応じて、必要なサイズで、必要な数だけ、必要な時に」立ち上げることが可能です。

これにより、クラウドの特徴である柔軟性の高さを最大限活かせるようになり、「必要な時に必要なだけ」、もしくは「使わないときは止めていれば課金の対象にならない」といったことが可能になります。

さらに2020年9月には資本業務提携を行いました。これにより協業関係をさらに強化し、NTTデータグループが有するAI・データ活用領域を中心とするサービス・ソリューションと、Snowflakeが有するクラウド・データプラットフォームの連携を通じて、あらゆる組織のデータドリブン化を国内外で加速していきます。

これまでも各コア技術のパートナーとともに「AI・データ民主化」に向けた各領域についてご支援してきましたが、Snowflakeにより「データ蓄積・共有」の領域についても、データストレージや処理リソースの視点から、お客様のニーズに合わせて柔軟かつ高度なご提案が可能となりました。

NTTデータではこれからも、AI・データの民主化を取り巻くトータルの領域について、インフォマティカをはじめとする複数の革新的なテクノロジー群を組み合わせ、その有用性を最大限に引き出すことで、お客様のデジタル変革をより強力にご支援してまいります。


株式会社NTTデータ ビジネスソリューション事業本部 AI&IoT事業部
お問い合わせ informatica-info@kits.nttdata.co.jp
ホームページ https://enterprise-aiiot.nttdata.com/informatica/