ハネウェルとInformatica Enterprise Data Catalogを活用したデータ駆動型産業オートメーションの高速化

先日、インフォマティカの賞を授与する仮想イベントシリーズであるInformatica LiveでAI-Powered InnovationのためのIntelligent Data Summitを開催することができました。

AI-Powered Innovationに関するサミットの一環として、講演者はInformatica Enterprise Data Catalogの使用に関する洞察とベストプラクティスを共有しました。私にとっての目玉の1つは、ハネウェルのデータガバナンスCoE(センター・オブ・エクセレンス)のシニアマネージャーであるNader Anaizi氏と、データガバナンスを専門とするインフォマティカコンサルティングパートナーであるInformation AssetのCEO兼創設者であるSunil Soares氏による共同プレゼンテーションでした。

ハネウェルは、100年以上にわたってテクノロジーとデータで革新を続けてきました。同社が「未来はあなたのデータに隠れています」と述べているように、データ主導のビジネスモデルを構築し、完全に管理されたデータの使用を民主化することは、ハネウェルの成長戦略の中心となっています。

航空宇宙、製造、コネクテッド産業用ソフトウェアを含む5つのコアビジネスで、同社は非常に複雑なデータランドスケープの中、運営されており、複雑なエンタープライズシステム、データベース、データウェアハウス、ETLツール、Hadoopクラスタ、その中でも、オンプレミスとクラウドにわたるビジネスインテリジェンスツールなどの数千のデータソースにペタバイト規模のデータが広がっています。

デジタルトランスフォーメーションイニシアチブを加速し、企業全体で完全に管理されたデータの民主化を可能にするために、ハネウェルはInformatica Enterprise Data Catalogを選択しました。同社は、エンタープライズデータガバナンスとセルフサービスアナリティクスを可能にするための基本的なコンポーネントとして、中心的かつ全体的なデータカタログを構築したいと考えており、同時にITユーザーとビジネスユーザーがデータを簡単にカタログ化、発見、検証、コラボレーションも検討していました。

Enterprise Data Catalogには、ハネウェルチーム(IT、ビジネスアナリスト、データスチュワード、データアナリスト、データサイエンティスト)が非常に有益であると感じた機能がいくつかありましたが、特に4つの機能がEnterprise Data Catalogの使用を強化したときに非常に際立っていました。:

  • Googleのようなセマンティック検索: Enterprise Data Catalogの検索機能により、「セルフサービス」の概念がユーザーにとって現実のものになりました。データアナリスト、データスチュワード、およびデータサイエンティストは、ITに依存することなく、必要なデータを簡単かつ迅速に検索できるようになったと初めて感じました。ユーザーは、慣れ親しんだ環境でナビゲートしながらシンプルにビジネス用語を1語入力すれば、関連するデータを簡単に見つけることができます。

  • データプロファイリング:認定された高品質のデータ資産を特定して作成することは、企業全体のデータの民主化加速を望むハネウェルチームの主な目的でした。そのため、値の分布、データタイプ、データドメイン推測、データ品質ルール、スコアカード、メトリックグループなどの包括的なデータプロファイリング統計、およびデータ資産の品質を理解するための技術メタデータを持つことは、ユーザーが非常に有益だと感じたEnterprise Data Catalogの重要な機能の一つでした。
  • エンドツーエンドのデータリネージ:データを迅速に検出することに加えて、ユーザーにとって同様に重要なのは、ソースからデスティネーションまで、詳細なレベルのデータリネージを簡単に視覚化して理解できることでした。彼らは、各データ資産がデータパイプライン全体およびデータライフサイクル全体で受けたすべてのデータ駆動型トランスフォーメーションの詳細を取得することができました。たとえば、Enterprise Data Catalogの使用を開始したばかりのユーザーでも、ビジネス用語を検索し、それが複数の場所で表されている場所を見つけ、データがどのように流れ、変換が起こり、そのデータ資産が最終的にどこに到達したかを視覚化できました。
  • 自動通知:データ資産を追跡し、自動通知を受信する機能は、ビジネスユーザーにとって際立ったもう1つの重要な機能でした。たとえば、関心のあるデータ資産を追跡し、それらのデータ資産に変更が加えられるたびに、自動的に生成される通知を受け取ることができます。

実装と主な調査結果

ハネウェルがソリューションを展開するまで、開始から終了まで6週間かかりました。この中には1日もかからなかったEnterprise Data Catalogのインストールも含まれています。残りの実装には、環境の構成、カスタムメタデータモデルの構築(自社固有の要件を満たすために必要でした)、複数のデータソース(SAP HANA、Oracleリレーショナルデータベース、Informatica PowerCenter、Tableauなど)からのデータのスキャン、ビジネスユーザーに価値を示すためのパイロットの実施、およびユーザーのトレーニングが含まれていました。

パイロット期間中、ハネウェルチームは、複数のシステムにまたがり、複数の機能で使用されるデータ資産に対して、複雑でありながら詳細な分析を実行する方法を45分で示すことができました。Enterprise Data Catalogを導入していなければ、チームがこの分析の結論を出すのに数週間かかったでしょう。

Informatica Enterprise Data Catalogの詳細については、こちらの動画もご覧ください。



本ブログは10月16日のManeeza MalikによるHoneywell Speeds Data-Driven Industrial Automation with Informatica Enterprise Data Catalogの翻訳です。