クラウド時代のデータ連携を可能にするiPaaSとは?

iPaaS(integration Platform-as-a-Service)は企業において分断されたシステムを接続し、ソリューションの統合を実現するためのプラットフォームを提供するクラウドサービスです。システム間のデータを連携することで、システムの統合とデータの共有を可能にします。

昨今の新型コロナウイルスの影響により、企業における業務のデジタル化の課題が浮き彫りとなりました。もちろん以前から業務自体を効率化するために多くの業務システムが導入されており、多くのデータが蓄積されています。しかし、すべての業務プロセスに対して横断的にデータがスムーズにつながり、意思決定や業務遂行ができている企業はどれくらいあるでしょうか。今回は、いまの時代に欠かせないiPaaSとその価値について説明します。

システム連携の必要性

デジタルトランスフォーメーション(DX)を実現し、リアルタイムな意思決定を支えるために、企業内の様々なシステムとそのデータをいかに連携して活用するかということは多くの企業にとって長年の課題でした。企業では、すでに業務システムごとにデータが蓄積されています。しかし、各システムのデータは個別に設計、管理されているため、意味のあるデータとして活用することが困難でした。一方で、経営者にとっては意思決定のための統合された情報が必要で、業務側では適切なサービスや顧客のエクスペリエンスを向上するためにシステムのデータ連携が必要です。これからの時代を生き残るために、データの連携と活用は待ったなしなのです。

システム連携における課題

しかしながら、各システムのデータ連携は容易ではありません。各システムは異なるプラットフォームやデータベースシステムで構築されているうえ、データ構造や粒度もまちまちです。たとえば、同じ製品を指すデータでも、設計システム、生産システム、販売システムのそれぞれで異なるコードで管理されていたり、管理されている単位が異なることもあります。このような多様なデータソースに対して個別の連携システムを開発すると、非常に多くのコストと手間がかかります。また、ビジネスの変化に伴う各業務システムの仕様変更も継続的に必要で、密結合でスパゲッティ化した接続の管理ではすぐに破綻するでしょう。これらのシステム連携課題を解決するために、ハブのような位置づけでシステム間の疎結合を実現するのがiPaaSなのです。

従来のソリューションとiPaaS

従来、データ連携のツールとしてはETL(Extract、Transform、Load)やEAI(Enterprise Application Integration)と呼ばれるツールがありました。ETLはバッチ処理で大量のデータを処理することを得意とし、EAIはトランザクションに近い粒度でアプリケーション間連携を得意としていました。

これらのツールは従来オンプレミス環境で構築されてきましたが、大量のデータを扱うため大きな初期投資が必要でした。また、バッチ処理では、処理の最大時に合わせる必要があるため、サイジングや投資の妥当性を判断するのが非常に難しいという側面もありました。 そこでクラウドサービスのSaaS型アプリケーションとして登場したのがiPaaSです。iPaaSはintegration Platform-as-a-Serviceの略で、統合プラットフォームを提供するサービスを指します。iPaaSにより、ETLやEAIの機能を、クラウドサービスの特徴である初期投資の抑制、利用ベースのコスト最適化、システム運用や保守の簡略化などのメリットを享受しながら実現できるようになりました。

iPaaSの機能と検討ポイント

iPaaSで提供される基本的な機能は、各システムに接続し、あらかじめ定義されたデータベースのフィールドのマッピングや処理に従って、指定されたタイミングでデータを取得します。そして、加工されたデータを必要なデータベースに格納します。システム間の連携を基盤として提供することで、開発工数を削減し、運用時における要件や各システムの仕様の変更への対応をシンプルにします。

iPaaSのコアな役割はシンプルですが、検討する際のポイントもいくつかあります。

  • 各システムへの接続方式

システムのデータに接続する際は、ODBCなどの汎用的なドライバを介してデータベースに接続する場合と、APIを介して接続する方法があります。データベースに接続する場合は、各システムのテーブル構造などをすべて把握しておく必要があります。API接続の場合には個別に開発することも可能ですが、あらかじめ主要なサービスへのアダプタが提供されていると開発や運用工数を削減でき、安心して利用できます。

  • 対応データ

対象となるデータはRDBMSに格納されている構造化データとは限りません。共有フォルダに格納されているExcelファイルなどの非構造化データ、jsonファイル、Kafkaなどのストリーミングデータにも対応しています。自社で抱えるデータの種類やフォーマットもツールとマッチしているかの確認が必要です。

  • ビッグデータの対応

分析用のデータマートを構築する際は、データソースによってはビッグデータを扱うこともあります。Databricks、AWS Redshift、Azure Synapse、Google BigQuery、Hadoop、Spark、Snowflakeなどのプラットフォームに最適化されているかを確認し、運用に耐えられるかを確認します。

  • データの品質

各システムのデータの整合性を保ち、マスターデータを参照しながらデータの揺らぎを補正するなど、データ品質を保つための仕組みもデータ活用においては重要になります。

  • セキュリティ

各業務システムのデータソースは異なるアクセス権管理が行われており、セキュリティ管理が適切にできることや、クラウドサービスにおける不正アクセスへの対応なども検討のポイントです。またデータを本番環境からテスト環境のデータベースへとコピーする際、機密情報をマスクしコピーするデータマスキングについても考慮する必要があります。

このように、iPaaSに求められる要件は多岐にわたります。iPaaSは単なるツールではなく、データ活用のためのプラットフォームとして位置づけることが重要になります。また、近年はデータレイクを構築し、分析だけでなく機械学習のデータとして活用するなど、データ活用の用途はますます広がりを見せているため、利用シナリオに合わせて検討することが求められます。

まとめ

このように、今後データ活用のための基盤としてその重要性がますます高まるiPaaSですが、そのためには基盤として企業の要件に見合った製品を選択することが重要です。導入後の活用や運用を見据え、単にデータ連携をできるだけではなく、質と量、そして利用用途に応じた関連する様々な機能を包括的に提供している製品をご検討ください。

インフォマティカでは、Informatica Intelligent Cloud Services(IICS)をiPaaSとして提供しています。また、合わせて30日間の無料トライアルもご利用いただけます。