【パートナーブログ:NTTデータ】AI時代のデータ活用価値を最大化する、「ビッグデータ」のデータマネジメントへ

こんにちは。インフォマティカ・ジャパン編集部です。

パートナーブログシリーズ、続いては株式会社NTTデータ様からです。

今回はAI時代のデータ活用価値を最大化する、「ビッグデータ」のデータマネジメントについて寄稿頂きましたので、是非ご一読下さい。

 


 

「ビッグデータ」という言葉が急激に注目されて早や数年が経ちますが、近年はビッグデータ活用と言えば「AI」という言葉が必ずと言っていいほど付いてくる時代になりました。NTTデータでも、AIを活用したいというお客様から多数のご相談を頂いています。

NTTデータでは従来から情報活用グランドデザイン、アナリティクスのプロジェクトを多数ご支援してきていますが、特にこの数年は先進的なAIソリューションの発掘にも力を入れています。グローバルのAI先進技術パートナーとも連携し、積極的に展開を進めています。

2017年3月には、AIとIoTを専門とする組織も立上げました。情報活用(アナリティクスやAIも含めて)のチームに加えて、データマネジメントのチームも一つの組織になって、「データの活用」に関する最上流から最下流までのスペシャリスト達が集まりました。AI×データマネジメントがもたらす成果へ期待されるお客様のニーズへお応えしています。

AIの代表例である機械学習の分野では2017年7月に、米国DataRobot, Inc.社のパートナーになりました。同社が提供する「DataRobot」は高精度な予測を今までにない使いやすさで実現する機械学習自動化プラットフォームで、ビジネス上の課題に対し実現性のある予測テーマをお客様と共に設定し、信頼できるデータセットを用意すれば高精度な予測モデルを自動で構築してくれる非常に優れた製品です。

ただ一度作った予測モデルは、現場の変化、ビジネス環境や顧客ニーズの変化に伴って、どうしても段々と精度が落ちてきます。そこでNTTデータは、精度劣化を検知しリモデリング(再学習)を自動で行うことで、精度を維持する技術を開発し、「AICYCLE ™(アイサイクル)」というソリューションとして提供開始しました。

(こちらも併せてご覧ください。※NTTデータのWebサイトが開きます)

http://www.nttdata.com/jp/ja/news/release/2017/070401.html

http://nttdata-aistudio.com/datarobot/index.html)

機械学習を単体で動かすにも、AICYCLEのような仕組みを動かすにも、優れたAIエンジンに加えて、AIへの信頼できるデータ供給、予測結果データと実績データの自動収集など、「データ」の整備に関わる仕組みは不可欠です。

AIを使いこなすには、「ビッグデータ」の「データマネジメント」が鍵であり、インフォマティカのビッグデータソリューションは、まさにこの領域の強力なツールと考えています。

AIへの注目は目覚ましいものがありますが、一方で、AIエンジンさえ導入すれば効果が得られると思われがちでもあります。

実際、ここ最近の事例を見ていると、データは沢山あるのだが本当に必要なデータが手に入らない、そのままの状態では汚れていて使えない、手作業でAI供給データを切り貼りしていて膨大な準備時間がかかった、などといったお悩みの声があるのも現実です。つまり、「準備に時間がかかり」、「精度が出ず」、「ワンショットの分析用に終わってしまい」、「次のテーマでもまた同じ課題をくり返してしまう」といった状態とも言えます。

実際のビジネス場面でAIを「実用」していくには、高精度であることはもちろんですが、定常的にAIへデータ自動供給ができ、日々進化していく分析目的やニーズに合わせて、どんどん新しいデータを発見し続け、AIへ供給するデータセットも刷新し続けることが必要になります。先程の状態と対比すると、「スピーディに準備でき」、「高い精度で」、「定常的・継続的に」、「次のテーマへ発展的なデータも手に入る」という状態を目指したくなります。

この、データ準備のスピードと、新しい分析活用への発展性をもたらすのがビッグデータの「データマネジメント」だと考え、インフォマティカのビッグデータソリューションを軸にして下図のように3つの領域(または、ステップ)で捉えています。

また、NTTデータは「データの活用についての最上流から最下流まで」をお客様へ提供するにあたって、予測分析活用のプロセスを用意しています。これと合わせて、上述の3ステップのデータマネジメントを組み合わせていくことが可能です。下図をご覧ください。

AIを代表とするデータ活用において、より正確な、より高度な、より民主化された活用レベルへと上げていくために、AIまわりと共に、この3ステップのデータマネジメントで、お客様ビジネスでの実現をサポートしていきます。

上述の機械学習自動化プラットフォーム「DataRobot」も、着実に導入実績が増えて来ました。また、精度品質維持を実現する自動化技術である「AICYCLE」のご相談も増えています。これからはデータ活用民主化へのステージであり、インフォマティカのようなビッグデータソリューション無くしては成し得ない、高い活用目標を目指す段階が見えてきたと感じています。