データガバナンスの有効性を決定するデータカタログ~外せない5つの機能~

ビジネスのグローバル化とテクノロジーの発展に伴って、日々さまざまなデバイスから多種多様で膨大な量のデータが流れこみ、それらのデータは、オンプレミス、クラウド、マルチクラウドなどさまざまな環境に分散しています。

さらに、EU一般データ保護規則(GDPR)やカリフォルニア州消費者プライバシー法(CCPA)は、顧客の個人データを全社レベルで把握することを義務付けており、個人データの保護規制は厳しくなる一方です。

従来のデータ管理手法では、こうした企業データの増加や複雑性には、もはや対応が難しくなってきています。

把握も分類もできないものは管理できない

地理的、組織的あるいは技術的に分断された大量のデータの中から、重要なデータだけを特定し、業務に関連性の高いデータをすばやく検索して、データの機密性を保護しながら、誰でも簡単に利用できるようにするには、何から手をつければよいのでしょうか?

この課題に取り組んで、デジタルトランスフォーメーションに成功した2社の事例をご紹介しましょう。

PayPal社は全社規模でデータを民主化

PayPalは、同社の口座間やクレジットカードでの送金・入金を複数通貨で取り扱うグローバルなオンライン決済サービスを提供しています。同社は、顧客の銀行口座や決済取引に関する財務データの増加に伴い、それまで手作業で行っていたデータ管理を自動化して効率性を高めたいと考えました。そこで同社は、最先端のデータ統合ソリューションを導入してデータガバナンスを自動化し、データの管理、監査、保守に関するルールを徹底し、全社規模でデータを民主化しました。これによって、同社の従業員は、必要なデータへ簡単にアクセスできるようになり、他社に先駆けて新しい決済サービスをリリースすることが可能になりました。

アイルランド銀行はデータガバナンスで部門間の足並みを揃える

アイルランド銀行は、EU一般データ保護規則(GDPR)などの業界規制を遵守しつつ、顧客ニーズの変化に対応するために、デジタルトランスフォーメーションに着手しました。その第1ステップとして、各部門が抱える次のような疑問を解消することが必要でした:

―どのようなデータがあるのか?

―重要なデータを特定する方法は?

―そのデータは適切に保護されているか?

―そのデータはどのプロセスに影響を及ぼすのか?

同行は、最新のデータ管理ソリューションを導入することで、これら全ての疑問に答えられるようなデータガバナンスを実現しました。

この2社のデジタルトランスフォーメーションの成功に欠かせなかったモノ・・・それは、エンタープライズ規模のインテリジェントなデータカタログです。データカタログは、あらゆる場所に分散したデータ資産の属性を自動収集して分類することで、Google検索のような迅速かつ簡単な探索を可能にしてくれます。

データカタログについて詳しくは、こちらの記事も参考にしてください。

データカタログに絶対外せない5つの機能

データカタログなら何でもいいという訳ではありません。全社規模でデータ資産を可視化し、業務要件に応じて最も関連性と信頼性の高いデータにユーザーが簡単かつセキュアにアクセスできるようになるための絶対条件があります。

次の5つの機能がなければ、結局は、異種データソース間のインターフェイスを構築する手間がかかり、細かい調整を手作業で調整する羽目になり、業務ユーザーが理解できずにIT部門の負担が減らないという結果に終わってしまいます。

広範な接続性と自動スキャン

さまざまなソースのデータをシームレスに扱える広範な接続性があることが重要です。これは、オンプレミスあるいはクラウドにあるデータ、IoTやSNSなどのビッグデータ、アプリケーションデータ、構造化/非構造化/半構造化データなど多岐に渡ります。こうしたデータの属性となる多種多様なメタデータを自動的にスキャンして抽出できるのはもちろん、業務ユーザーがデータの付加属性を付与できて、これらをカタログ化できる能力が必要です。

2. データリネージ(来歴)と影響分析

誰が、いつ、どのようにデータを変更したのかという変更履歴、データソースからターゲットまでのリネージュ(来歴)を可視化できることが必要です。さらに、社内の業務ルールや社外の規制、データの機密性を保護するためのルールと関連づけて、データの影響分析ができることが必要です。

3. データ品質の監視

データプロファイリング統計(値分布やその他のパターンなど)や技術メタデータを可視化して、データの信頼性を一貫して確保できることが必要です。

4. AIによる自動化

データセットの数は数千にも及び、それぞれに数百もの列と数千もの業務用語が格納されているため、データの特定とタグ付けを手作業で行うのは非現実的です。データディスカバリやレポート生成に何週間も何か月も要していては、その価値が大きく損なわれることになります。AIを使って、データのキュレーション、タグ付け、分類、類似データ検出、業務用語と技術データ資産の関連付けなどのプロセスを自動化できることが重要です。

5. 関係者全員のコラボレーション

企業データのガバナンスは、もはやサイロ化された取り組みではありません。業務部門とIT部門が協力して、データを管理・活用するためのフレームワークとして、データカタログが力を発揮します。

データを扱う全関係者(ITアーキテクト、データ責任者、データスチュワード、データ利用者など)の集合知と専門知識を活用できるコラボレーション機能を使って、データの利用者がタグ付けし、利用した際のコメントや評価、承認を実行できることが重要です。

今日のデジタル経済では、企業データを効果的に活用する能力が企業の成否を分けます。それに欠かせないのが、インテリジェントなデータカタログです。

AIを駆使したインテリジェントなデータカタログについて、詳しくはこちらをご覧ください。

コメント