エンタープライズクラスのデータカタログを見極めるための6つのポイント

2017年12月、ガートナー社から“Data Catalogs Are the New Black in Data Management and Analytics.” [1]というレポートが発行されたことにより、データカタログへの注目が集まりました。ここ数年、データカタログの需要はますます高まってきています。そしてこの1年については、独立型のデータカタログ、クラウドプラットフォームプロバイダーから提供されるドメイン固有のデータカタログ、データ準備や分析などの他のツールに埋め込まれたデータカタログなど、様々な種類のデータカタログが発売されました。

それと共に、多くの企業がデータ主導のビジネスへと移行し、データのランドスケープはますます複雑になりつつあります。そこで、最新のデータ環境を基盤としたインテリジェントなエンタープライズクラスのデータカタログが登場しました。このようなデータカタログは堅強かつ適切に設定されており、エンタープライズ規模のメタデータ基盤を提供してデータにコンテキストを追加します。そしてメタデータ主導の人工知能と自動化を促進し、すべてのデータ管理プロジェクトの実装を簡素化、加速することができます。

その一方で、これはどのような市場においても言えることですが、選べるオプションが増えることは必ずしも顧客にとってプラスになるとは限りません。それどころか、データカタログ化のソリューションには、以下のような制約があることがほとんどです。

  • データカバレッジ:特定のシステムやプラットフォームに限定されており、企業データランドスケープの完全なビューを提供することができない。
  • 使用事例:データガバナンスやセルフサービス分析など、1つの事例に限定されているため、データ主導のビジネスすべてをまとめてサポートすることができない。
  • リネージ:システム間や、クラウドおよびオンプレミス全体でデータリネージを追跡したり、コード(ストアドプロシージャ、ETLなど)や複雑なアプリケーションから系統を抽出する機能が制限されている。
  • メタデータ:基本的な技術メタデータのキャプチャに限定されるため、ビジネス、運用、使用状況のメタデータなど、他から得ることができる貴重なコンテキストを提供できない。
  • スケール:数千万のデータ資産をスキャンし、カタログ化するといった、大規模なエンタープライズクラスの要件に対応できない。

すべてのデータをカタログ化し、データ主導のビジネスを円滑にするメタデータ基盤を提供できるようなエンタープライズクラスのカタログを求めているのであれば、制限のあるカタログを選択することは非効率になるかもしれません。データ主導のビジネスを強化するには、適切なデータカタログを選択する必要があります。その際は、次の6つの項目を参考にしてみてください。

1.すべてのデータをカタログ化できるかどうか?

オンプレミスデータベースとデータウェアハウス、クラウドデータストア、BIツール、ETLツール、レガシーおよびメインフレームシステム、企業内の複雑なアプリケーションなど、企業におけるすべてのデータソースからメタデータをスキャンし、キャプチャできるデータカタログを探しましょう。

2.データリネージや、何か変更があった際の影響を確認できるかどうか?

ストアドプロシージャやELTコードなどの複雑なデータ変換にドリルダウンする機能を含め、システム、クラウド、オンプレミス全体を見通すことができ、細かくエンドツーエンドのリネージを提供できるデータカタログを探しましょう。

3.AIやMLを活用してデータのキュレーションを自動化できるかどうか?

手動でクラウドソーシングされたデータのキュレーションだけでは、効率的なスケーリングは望めません。AIやMLを用いて、ドメイン検出、タグ付けと分類、類似データの検出、ビジネスで使われる用語集や物理的なデータ資産の関連付けが自動化できるかを確認しましょう。

4.そのデータカタログをシームレスに活用できるかどうか?

企業全体に散らばっているデータを効率的に調べることができ、人間の専門知識とうまく組み合わせて活用できる状態になることが理想です。

5.そのデータカタログですべてのビジネス事例をサポートできるかどうか?

データガバナンス、データプライバシー、セルフサービス分析、クラウドの近代化など、主要なビジネス事例に対処する統合ソリューションを探しましょう。

6.本当の意味で、エンタープライズ規模のサポートができるかどうか?

数百のデータソースにわたる、無数のデータオブジェクトをサポートできるデータカタログであるかどうかを確認しましょう。

データカタログがこれらの条件を満たしていない場合、ビジネス全般で必要とされる可視化が損なわれ、サポートに支障をきたす恐れがあります。データ主導でビジネスを推進するためには、エンタープライズクラスで「カタログのカタログ化」を行う必要があります。こちらについては、eBook “Drive Your Business Forward With a Catalog of Catalogs.”をご参照ください。データ主導のビジネスへと移行するための多面的なアプローチについて、Maersk社のケーススタディとともにご説明しています。スケーラブルなデータガバナンスプログラムの導入、クラウドデータレイクを使用したデータインフラストラクチャの最新化、ビジネスインテリジェンスとセルフサービス分析-これらはすべて、インテリジェントなエンタープライズクラスのデータカタログによって実現することができます。

[1] Gartner, Inc., Data Catalogs Are the New Black in Data Management and Analytics, by Ehtisham Zaidi, Guido De Simoni, Roxane Edjlali, Alan D. Duncan, 13 December 2017


本ブログは3月4日のDharma Kuthanurによる6 Ways to Tell If You have an Enterprise-Class Data Catalogの翻訳です。