クラウドデータウェアハウスへの移行に欠かせないものとは?

今日の企業が使用するデータソースは、ビッグデータやIoTデバイス、ビジネスアプリケーション、ソーシャルメディアのフィードなど、かつてないほどの膨大な量で増え続けています。先進的な企業は、クラウドデータウェアハウスのパフォーマンスと拡張性、柔軟性、リソースへの効率的かつ高速なアクセス性を利用することで、こうした大量のデータから斬新かつ革新的なインサイトを手に入れることで、競争力を強化し事業を拡大しています。

特に、Azure Synapseなどのパブリッククラウドデータウェアハウスは、堅牢な機能を提供しながらも、実質的な先行投資を必要とせず、クラウドの融通性、無限の拡張性、俊敏性を活用し、データソースとデータ量の増加に合わせてアナリティクス環境をすばやく拡張できるという多くの利点をもたらしてくれます。

しかし、オンプレミスでTeradataやNetezzaなどのデータウェアハウスに貴重な時間、スキル、スタッフを投入して何年もチューニングしてきたような企業にとっては、これらのシステムをクラウドに移行するのは、リスクが高く、気が遠くなるような道程に感じるかもしれません。また、法規制へのコンプライアンスなどのさまざまな理由から、資産(データおよびアプリケーション)をオンプレミス環境に保持しておかなければならない場合があります。

つまり、大抵の場合は、たとえ新しいクラウドデータウェアハウスを導入したとしても、オンプレミス資産が残ることになります。オンプレミスにあるデータソースとクラウドデータウェアハウス間のデータ統合は継続することになり、クラウドデータウェアハウスと他のクラウドベースのデータソースとの間でもデータ統合が必要になります。

このように、オンプレミスとクラウドが混在する複雑なハイブリッド環境で、重要な業務データフローを中断することなく、クラウドの膨大なコンピューティング能力を活用したアナリティクスを可能にするためには、異種環境間のデータ統合に関わる問題を解決できる高度なデータ管理ソリューションが必要です。

以下の項では、クラウドデータウェアハウスとのデータ統合を迅速に実現するインフォマティカの2つのソリューションについてご紹介します。

インテリジェントなデータカタログ

クラウドデータウェアハウスへのデータ移行には、すべてのデータ資産の保存場所やデータリネージを調査して、既存のデータ環境全体を把握することが不可欠です。

インフォマティカのインテリジェントなデータカタログソリューションであるInformatica Enterprise Data Catalogは、AI主導のメタデータ管理と機械学習ベースのデータディスカバリ・エンジンを使って、数千万件を超えるような組織内のあらゆる種類のデータとデータの関係を探索してカタログ化し、機密データや下流プロセスとの依存関係の特定、データリネージをエンドツーエンドに追跡するプロセスのすべてを自動化することで、データ資産を完全に把握するための時間を最大90%短縮します。

インテリジェントなデータカタログがあれば、既存のデータウェアハウスから最新のクラウドデータウェアハウスへ段階的に移行するデータの優先順位を決定し、移行後もデータのリネージを維持することでデータ業務の中断を最小限に抑えながら、アナリティクスの生産性を飛躍的に改善することができます。

インテリジェントなデータカタログについて詳しくはこちらのブログ記事を参考にしてください。

インテリジェントなデータ統合

クラウドデータウェアハウスを最大限に活用するには、社内外のさまざまなソースからデータを引き出す必要があります。

インフォマティカの次世代iPaaSであるInformatica Intelligent Cloud Services(IICS)は、オンプレミスとクラウドの両方のデータ統合をサポートするクラウド型データ管理プラットフォームです。Microsoft Azure Synapse、Amazon Redshift、Google BigQuery、Snowflakeなどのクラウドデータウェアハウス向けのデータ統合、アプリケーション/プロセスの連携のための200以上のネイティブコネクタと、10万以上のアプリケーションやデータベースなどのエンドポイントへの接続など、統合に必要なすべてのツールをあらかじめ用意しています。

プログラムをコーディングしなくても、データとプロセスのマッピングツールを使って部品を組み合わせるだけで、データの抽出からデータ形式の変換、関数を利用した加工やマスキングなど、さまざまなデータ統合処理を自動化して、統合を再利用することができます。さらにデータ移行は、バッチ/リアルタイムストリーミング/変更データキャプチャなどの任意のレイテンシで実行することができます。

また、AIと機械学習を使ってデータのプロファイリングを自動実行し、類似データの過去のパターンに基づいてデータのタグ付けや統合を自動的に実行し、類似データに適用されたルールに基づいてデータ品質ルールを適用することで、データ品質の問題を継続的に解決することができます。

Informatica Intelligent Cloud Services(IICS)について詳しくはこちらのページをご覧ください。

最後に

インフォマティカは、Microsoftとの長年にわたるパートナーシップによって、同社のクラウドデータウェアハウス製品との連携を強化しています。インフォマティカのIICSは、数百を超えるオンプレミス、クラウド、SaaSアプリケーションをMicrosoft Azure Synapse Analytics(旧Azure SQL Data Warehouse)に接続するためのコネクタをあらかじめ用意しており、Azure Synapseに迅速にデータを変換して移動するプロセスを合理化することで、お客様のデータ主導のデジタルトランスフォーメーションを後押ししています。

Azure Synapseへの移行メリットについては、電子ブック「データの可能性を最大限に引き出す~ペタバイト規模のデータを迅速かつ効果的にAzureデータウェアハウスに移行するための3ステップ」をご覧ください。

また、Azure Synapseへの移行手順の詳細は、電子ブックMicrosoft Azureを活用したクラウドデータウェアハウジング~Azureで最新のデータアーキテクチャを構築するためのワークブックをご参考ください。