5つの業界トレンドから学ぶデータカタログの必要性

2020年は、多くの人々がさまざまな挑戦を強いられた年として記憶に残ることになるでしょう。現時点では、まだ完全に安心はできませんが、2021年が始まって少し経った今、世界が少しずつ快方へ向かっているように思えます。今年に入って新型コロナウイルスのワクチンが広く配布、投与されていることから、状況改善への兆しが見えてきたのではないでしょうか。

インフォマティカは、ガートナー社の2020年マジック・クアドラントにおいて、メタデータ管理の「リーダー」として選出されました。[1]ガートナー社の調査では、2021年に勢いを増していくと思われるトレンドが示されています。例えば、デジタルトランスフォーメーションのイニシアチブが業界全体で大幅な増加を見せており、業種や企業規模の大小に関わらず、あらゆる企業がデジタルトランスフォーメーションに踏み出そうとしています。IDCの調査では、2024年までにIT業界内における総支出の50%以上がデジタルトランスフォーメーションに割り当てられると予測されています。さらに、この分野のCAGR(年平均成長率)は2020年から2023年にかけて15.5%成長し、企業がデジタル化するにつれて、投資額は6.8兆ドルにまで達する見込みです。[2]

トレンド#1:大規模な「データリテラシー」

これまでにインフォマティカを導入した企業の多くは、データのカタログ化がデジタルトランスフォーメーション戦略の中核であるという考えを示しています。実際に、データのカタログ化はあらゆる戦力的ユースケースを支えてきました。例えば、データ使用を民主化することでセルフサービスの分析やAIを大規模な範囲で可能にするなど、企業全体のデータガバナンスやコンプライアンスイニシアチブを有効にし、マルチクラウド環境への移行を加速してきました。この傾向は、2021年もより速いペースで持続すると予想されます。

すでに多くの人々が表明しているように、「データリテラシー」になる必要性はかつてないほど高まっています。企業にとっての「ニューノーマル」は、俊敏性、応答性、競争力を維持しつつ複雑なデータのランドスケープ内でうまく機能するという点にとどまらず、リモートワークに関するサポートも視野に入れて展開していくと思われます。

「データリテラシー」を実現するためには、データを完全に可視化する必要があります。そのためには、企業におけるデータの内容や場所をすべて把握することが求められます。また、必要なデータを迅速に発見する能力や、データの品質、そのデータがいつから存在しているか、プライバシー、ガバナンスの制約、所有者、そのデータの使用が認定されているかどうかなど、データ関連の詳しい情報を理解することが必要です。このような状態は、データコラボレーションの文化を継続的に育むことで実現します。ガートナー社は、「2023年までに、データ共有に力をいれる組織がビジネスにおける多くの面で他社をしのぐ成果をだすことが予測されます」と述べています。 [3]

トレンド#2:データサイエンスとAIが主流に

2021年は、データサイエンスやAIの活用がさらに重要度を増すでしょう。Forbes社の調査によると、全企業の76%が2021年のIT予算をAIや機械学習へ優先的に投資すると推定されています。[4]機械学習のアルゴリズムやRPAを活用することで、企業のアプリケーションやビジネスプロセスが自動化し、大規模なインテリジェンスを展開することが可能になります。このように機械学習の採用はますます普及していく傾向にあります。

ビジネスプロセスやデータ、分析、AIパイプライン(データの取り込み、データのカタログ化、データガバナンス、データの品質とプライバシー、データの準備、データモデリング、分析、データの可視化など)における自動化や統合が進むことで、企業はAIやデータサイエンスの真価を引き出し、より質の高いビジネスにつなげることが可能です。また、データサイエンスやAIの使用を専門家のみの小規模な範囲から組織内の広範なユーザーコミュニティにまで広げることができるようになります。

インフォマティカは、機械学習やデータ管理、データ統合の重要性に早期から着目していました。例えば、メタデータ主導であるCLAIRE®AIエンジンを搭載したEnterprise Data Catalogは、高度な機械学習アルゴリズムによってデータキュレーションやメタデータ管理タスクのホストを自動化したり、インテリジェンスを追加します。具体的には、データの検出や類似するデータの照合、関連するビジネスがある場合にデータの推奨などを行います。

Enterprise Data Catalogによって、多くの企業で迅速なデータ検出やデータ統合が可能になりました。インフォマティカの製品はCustomer 360、フリート機能の最適化、リスク管理をはじめ、昨今では新薬の開発に貢献するなど、さまざまなセルフサービス分析とAIイニシアチブ運用化をサポートしています。

トレンド#3:単一のクラウドからマルチクラウドへ

クラウドを取り入れることは、コストの削減、イノベーションの推進、アジリティや効率を高めるといった戦略的イニシアチブにとどまらず、ビジネスを継続させる要素として企業にメリットを与えます。IDCは、2021年末までに企業の80%がクラウドに移行する予定であると述べています。[5]さらに、全体のうち93%もの組織が2021年以降にマルチクラウド環境へ移行し、単一のベンダーに依存することで起こりうるリスクを回避することになるだろうという調査結果も出ています。

マルチクラウド戦略には数々のメリットがありますが、そのぶん複雑さも増します。企業は、サイロ化などの潜在的なリスクが伴う状況で、クラウドやオンプレミス環境全体にわたって複数のデータソースを管理しなければなりません。

このような複雑さを減らすために、多くの企業ではどのようなクラウドにも対応可能であるインテリジェントなデータカタログを活用しています。たとえばEnterprise Data Catalogを使用することで、求めるデータが管轄内のどのような場所にあろうと簡単に見つけることができます。また、エンドツーエンドのデータリネージと影響分析機能によって、データ変換が行われた場合は内容を詳しく把握することも可能です。これは、オンプレミス環境、マルチクラウド環境をはじめ、ソースからターゲットに至るまでの全てのデータライフサイクル内で適応することができます。さらに、企業は単一のデータカタログを確認するだけでデータの全体像を知ることができ、複数あるクラウド固有のデータカタログの維持や調整、切り替えなどをする必要がありません。

トレンド#4:高度なデータリネージへの需要

データリネージは、データ主導のデジタルトランスフォーメーションを成功させるカギとなる存在であり、これを把握することで企業全体におけるデータガバナンスやコンプライアンスの遵守、データウェアハウスの最新化、セルフサービス分析、AIの活用などがスムーズに行えるようになります。しかし、すべてのデータリネージツールが同じように作成されているわけではありません。そのため、2021年は高度なデータリネージ機能を求める企業が増えることが予測されます。包括的なデータカタログの構築に向けて、多数のデータソースから詳細な情報を抽出できるようなデータリネージへの需要がますます高まるでしょう。

企業データのランドスケープがより複雑になればなるほど、高度なデータリネージの需要も増していきます。さらに、企業の関わる厳格なコンプライアンスや規定を遵守したうえでデータサイエンスやAIイニシアチブをサポートできるよう、データを細かく理解する必要性が高まると思われます。

トレンド#5:MLOps(機械学習オペレーション)が軌道に

DevOpsから発展した考え方であるMLOpsは、企業内外のデータサイエンティストや、エンジニア、データ管理者をはじめ、データ運用のプロフェッショナル間における連携をスムーズにし、ライフサイクル全体を通した機械学習パイプラインの開発や作成をサポートします。AIを大規模に運用するうえで、MLOpsの導入は非常に画期的なものになるとされており、2021年はこの勢いが増す可能性が高いでしょう。ガートナー社は「2024年末までに企業の75%が本格的なAI運用に移行し、ストリーミングデータや分析インフラストラクチャが5倍になるでしょう。」と述べています。[6]

AI(機械学習、ディープラーニング)イニシアチブによって正確なモデルを構築するためには、質の高いデータを使用できるかどうかが大きなカギとなります。したがって、インテリジェントなデータカタログを活用することで MLOpsチームを強化し、必要なデータを迅速に発見、検証、コラボレーションする必要性が高まるでしょう。そうすることで、堅牢で反復的かつ継続的な機械学習パイプラインを構築することができるようになります。

詳細については、インフォマティカのEnterprise Data CatalogのWebページにアクセスしてください。また、最新の電子ブック「Drive Your Business Forward with a Catalog of Catalogs(カタログのカタログ化でビジネスを推進)」「Extract Value from Your Data with AI-Powered Data Discovery(AIを活用したデータ検出によってデータの真価を引き出す)」もあわせてご覧ください。

出典:

1.ガートナー社、メタデータ管理ソリューションのマジック・クアドラント、Guido De Simoni、Mark Beyer、Ankush Jain、 Alan Dayley、2020年11月11日

2.IDC FutureScape: デジタルトランスフォーメーションの世界的な動向に関する2021年の予測

3.ガートナー社、デジタルビジネスを加速するデータ共有の必要性、Lydia Clougherty Jones、2020年12月3日

4.Forbes社: 企業の76%が2021年のIT予算でAIと機械学習を優先

5.Data Center Frontier: IDC、2021年に企業のクラウドシフトが加速すると予測

6.ガートナー社、データと分析のトレンドトップ10 、2020、Rita Sallam他、2020年5月11日


本ブログは2021年3月22日のManeeza MalikによるFive Industry Trends That Drive the Need for Intelligent Data Catalogingの翻訳です。