人工知能/機械学習とデータマネジメントの「切っても切れない」関係

皆さん、こんにちは。インフォマティカ編集部です。

今回は、弊社CEOの Anil Chakravarthy が久々にデータマネジメントとAI/MLの関係と必要性について解説しています。このキーワードから皆さんは何をイメージされるでしょうか。


人工知能(AI)と機械学習(ML)は、今、世界中のあらゆる業界で起こっているデジタルトランスフォーメーションに拍車をかけています。AIやMLは、ライフサイエンス業界における新たな治療法の発見、金融サービス業界における不正とリスクの回避、真にパーソナライズされた顧客体験を提供するうえで欠かせない存在です。

エンタープライズAI/MLにデータ管理が必要な理由

AIの成否は、データサイエンティストが設計するモデルが、AIの訓練と拡張に有効かどうかで決まります。そして、モデルの成否は、信頼できるタイムリーなデータがあるかどうかで決まります。インフォマティカ創立から20周年目の2013年にInformatica World®に登壇したMicrosoft社AI担当バイス・プレジデントのスティーブ・グッグス(グッゲンハイマー)氏は、このデータとAIの関係について、「データとインテリジェントに会話できなければ、AIとインテリジェントに会話することはできない」と述べました。それ以来、フォーブスやハーバード・ビジネス・レビューを含む多くの専門家たちが、この見解に同調してきました。

データサイエンティストたちの仕事は、AI/MLモデルを作ることです。その彼らに、なぜ高品質なデータが必要なのでしょうか。例えば、消費者行動を予測するためのモデルを作るとしましょう。郵便番号で特定できる消費者のロケーション(位置)は、こうしたモデルにとって貴重なデータです。しかし、その郵便番号が、欠如、不完全あるいは不正確なデータだったらどうなるでしょうか?モデルの行動は、AIの訓練中だけでなく、実装期間中にも悪影響を及ぼし、予測を誤り、データサイエンティストたちの努力がすべて水の泡になってしまいます。

一方で、データの妥当性が検証されていて、正確でかつ完全な郵便番号ならば、消費者の市場セグメントや所得層、年齢、平均寿命など、個人に関する多くのことを予測するのに役立ちます。尚のこと正しくあるべきです。

いずれは「説明できるAI」が、単に選択肢ではなく、規制として義務付けられる時代が来ると考えた方がよいでしょう。メタデータ駆動のリネージやトレーサビリティがなければ、AI搭載のアプリケーションやインサイトを、実運用させることはできないのです。

データ管理にAIが必要な理由

AI/MLは、データ管理を拡張する上で、非常に重要な役割を果たします。デジタルトランスフォーメーションには、大量のデータが必要です。それ故に、データの関連性やその価値、機密性を証明し、透明性を確保するためには、膨大なデータの中から、最も関連性の高いデータとメタデータを発掘してカタログ化することが必須です。さらに、そのデータをクレンジングして、マスター化し、効果的なデータガバナンスを実装して、データを保護しなければなりません。

せっかくのAI/MLモデルがあっても、データが効果的に管理されずに拡張もできなければ、過去30年にわたって従来型のデータウェアハンジングが格闘してきたのと同じように、低品質なデータを使って、信頼できないインサイトを提供してしまうという運命を辿ることになります。

これぞまさに、データ管理にAI/MLを活用すべき所であり、インフォマティカがメタデータ駆動型AI機能である「CLAIREエンジン」のイノベーションに、惜しみなく投資してきた理由です。CLAIREは、定例的なデータ管理やデータスチュワートのタスクを自動化して拡張するために、あらゆるエンタープライズ統合メタデータを活用します。

今年5月に開催されたInformatica World 2019には、2,600人が参加し、CLAIREの話題で持ち切りでした。とにかく私に言えるのは、その場で交わされたデータ/データマネジメントに関する会話の流れが、すぐにAIに変わったということです。それほど皆さんのAIに対する関心が高いという表れではないでしょうか。

皆さんのデータとAIの旅は、どこまで進んでいますか?


※本ページの内容の一部は2019年6月11日更新のUS Blogの抄訳です。

Enterprise AI/ML Needs Data Management. And Vice Versa.

著者:Anil Chakravarthy

コメント