クラウドデータ管理の価値:AWSのラフール・パサック(Rahul Pathak)とのQ&A

インフォマティカとAmazon Web Servicesは、クラウドへの取り組みにおいて10年以上にわたり協業し、長年のパートナーシップを築いてきました。インフォマティカのデータ管理担当シニア・バイス・プレジデント兼ジェネラル・マネージャーであるジテシ・ガイ(Jitesh Ghai)とAWSの分析担当ジェネラル・マネージャーであるラフール・パサック(Rahul Pathak)の対談では、顧客が関心を向けている事柄や最新のデータトレンドについて見解を深めることができます。


ジテシ・ガイ:私たちがサポートしている共通の顧客が最近どのような傾向にあるか、AWS社の見解をお聞かせください。

ラフール・パサック:扱うデータ量が急増し、データソースの種類も大幅に増加しています。

世界は、表形式データから半構造化データへと移行しています。また、データ量は5年ごとに約10倍に増加する傾向にあります。つまり、AWSとインフォマティカが協業している間に、顧客のデータは約100倍になっているのです。
また、クラウドへの移行も加速しています。私たちの顧客が求めるのは、俊敏性の最適化や大規模なデータを処理する方法です。つまり自動化です。更に、ビジネスを同時に最適化し、ビジネスの運用状況を把握しやすくするとともに、支出を最適化して使用状況にマッピングしたいとも考えています。このような要望に対しても、クラウドの柔軟性が貢献しています。

ジテシ・ガイ:私も同感です。弾力性、柔軟性、俊敏性といった経済的メリットによってクラウドはエキサイティングな空間となり、データや分析も大きな変革を遂げています。最初にデータマートとデータウェアハウスがあり、次にHadoopでデータレイクが普及しました。その後、EMR、Hive、Sparkが登場し、お客様からは「運用上の負担が大きいのでクラウドに移行したい」という声が上がるようになりました。

では今度は、現在のパンデミックについての質問です。この数カ月間で、リモート作業によるビジネスの継続が一般的になったのでしょうか?AWSはどのようにお考えですか?

ラフール・パサック:現在は調整の段階ですが、予測できないことが多く存在します。景気後退のため、事業を下方修正する必要に迫られている企業がある一方で、莫大な成長を遂げている企業もあります。ただ、より良い意思決定を行うためにデータの使用を開始したいという要望は全体的にあるようです。アーキテクチャが進化したことで、組織ではサイロ化していたデータを統合し、ビジネスや顧客を完全に把握する方法を検討していると思います。その結果、すべてのデータにアクセスして使用できるよう、クラウドデータウェアハウジングとデータレイク全体での統合が急増しました。その間にも、データの量は増え続けています。ですから、全体像を把握しビジネス価値を高められるような形式の変換を行う傾向が高まっています。

ジテシ・ガイ:先ほど述べられたように、自動化はアーキテクチャを操作するための基本となるものです。それだけでなく、組織内で急速に増え続けるデータ量をスケーリング、キュレーションするためにも自動化が必要です。では、自動化はデータや分析スタック内でどのように展開するのでしょうか?

ラフール・パサック:大量のデータを取り扱えるという点をはじめ、さまざまなレベルにおいて自動化は非常に重要です。これまでは長い間、手作業でキュレーションするのが実用的であるという考えが一般的でした。現在私たちの顧客が求めているのは、データをきちんと把握するための機械学習、自動化、インテリジェンスです。つまり、データのクリーンアップ、分類、強化、マスキング、保護などが必要とされているのです。ボリュームが大幅に増えていることから、プロセス自動化をしたいという考えが高まっています。

このような現状は、分析層での自動化や機械学習がますます増えることを意味しており、機械学習と予測アプリケーションの台頭が進んでいます。但し、すべては適切に運営、管理され、すぐに使用可能で信頼のおけるデータ基盤の上に構築される必要があります。信頼できるデータが、ダウンストリームで実行したい物事の開始点となるのです。

ジテシ・ガイ:インフォマティカでは、データ管理(データウェアハウス、データレイク、レイクハウス)の観点から見た場合、企業のワークロードと記録システムを適切にスケーリングするためには3つの柱が必要だと考えています。インテリジェントで自動化されたメタデータ管理データ統合データ品質です。

AWSでは、データ管理についてどのように考えていますか?インフォマティカではさまざまな製品を提供していますが、AWSにも独自で市場をリードする分析サービスがあります。

ラフール・パサック:私たちも同様の考えです。AWSとインフォマティカは、長く続くパートナーシップの過程においてそれぞれの分野でイノベーションを成し遂げ、顧客をサポートしてきました。そして先ほど仰ったように、メタデータを管理し、複数のソースからのデータが適切に統合された高品質なものであることを確認するのは、強固な基盤を構築するためにとても重要です。そこで私たちは顧客に対し、それぞれの業務に適切な分析ツールを提供し、すべてのデータをきちんと把握できるようにすることに焦点を当てています。

そのため、S3データレイク、EMRのようなサービス、データカタログにクエリを実行する機能用にデータウェアハウジングでAmazon Redshiftを提供する場合でも、AWSとインフォマティカはすばらしい相乗効果を生み出しています。私たちが連携をとって提供するサービスを土台として、顧客は分析アプリケーションを簡単に構築できるような形式にデータを取り込むことができます。

ジテシ・ガイ:では、顧客が今後直面するであろう課題は何だと思いますか?また、そのような課題に対してAWSではどのようなイノベーションを提供できるとお考えですか?

ラフール・パサック:全く更新しなくて良いというものは殆ど存在しません。顧客が求めるスケーラビリティ、セキュリティ、運用の信頼性については、これからも投資するつもりです。それに加えて、使いやすく操作しやすいソリューションとサービスの需要がさらに高まっています。また、サーバーレステクノロジーや、変動するトラフィック負荷を自動でスケールアップ、スケールダウンする自動化システムへの関心は、今後も寄せられ続けると思います。

ジテシ・ガイ:そうですね。AWS Lambdaはサーバーレス機能で業界をリードしています。また、サービスとしてのインフラストラクチャ(IaaS)、サービスとしてのプラットフォーム(PaaS)、分析サービスなどの柔軟なコンピューティング機能が特にデータ管理で活用されていますね。それによって、顧客はビジネスインテリジェンス(BI)、データサイエンス、データエンジン、スタック全体の処理の永続性など、 エンドツーエンドのクラウドネイティブスタック がもたらす完璧な経済的メリットを得ることができていると思います。インフォマティカもそのような点に貢献できるよう、クラウドネイティブの機能における革新を進めてきました。

AWSとインフォマティカのパートナーシップは、10年以上にわたります。私たちの提供するソリューションによってクラウドデータウェアハウスやクラウドデータレイクを構築できたという一般企業が多くあります。

ラフール・パサック:そうですね。インフォマティカが進化を続け、データスペースと長年向き合ってきた成果をクラウドネイティブ環境にもたらし続けているのは、パートナーの立場から見ても素晴らしいことだと思います。私たちの顧客にも、多くのメリットがもたらされているはずです。

例えば、Community Technology Allianceという団体では、複数の部門にまたがって分析とデータを統合し、ホームレスの自立支援を行っています。このような活動のサポートができるのはとても光栄なことです。私たちの提供するテクノロジーを使用することでRedshiftにデータを取り込み、そこから得られる可視化がコミュニティの成果に繋がっていることを嬉しく思います。

ジテシ・ガイ:私も、そのようなプロジェクトには心を打たれます。Community Technology Allianceは、対象範囲のホームレスを75%削減しています。まさに、データ主導で信頼のおける洞察がもたらす成果として素晴らしい例です。

また、新型コロナウイルス感染症(COVID-19)に関する ヘルスケアスペース で対策を行っている公共部門の顧客にも多くの成果が見られます。現在、医療提供者は、信頼できるデータを基盤として重要な決定を行う必要にいまだかつてないほど迫られています。例えば、人工呼吸器の供給や新型コロナウイルス感染者リストに関連したデータセットを特定することにより、メタデータを基盤としてデータ管理を行う医療提供者もいます。目を見張る働きです。

AWS re:Inventでは、フードサービス企業であるSyscoについても話されていました。今一度お話を伺えますか?

ラフール・パサック:ええ。Syscoは最大規模を誇る食品流通業者の1つであり、最新のインフラスにすることを目指していました。ちなみに、このような要望は他の企業でも多く見うけられます。レガシーシステムから移行する場合でも、Syscoのようにコアデータをメインフレームから移動する場合でも、企業はビジネスの運用状況をエンドツーエンドで把握することを目標としています。Syscoの場合、まずインフォマティカと連携してデータ移動と統合プロセスをさせ機能、オンプレミスで使用していた信頼できるデータがAWSへ確実に転送されるようにしました。

続いて、SyscoはAWSにおいて最新化に取り組みました。最終的には、データレイクにS3、サーバーレスクエリにAthena、そして最もパフォーマンスに敏感なデータウェアハウジングワークロードにRedshiftを組み合わせて使用​​することになりました。これは、まさに理想的なエンドツーエンドのストーリーであると言えます。大企業が自社とその分析インフラストラクチャを変革するという、素晴らしい例でした。

ジテシ・ガイ:まさにその通りです。今まで以上に食品サプライチェーン内での機能が円滑になることを保証できるというのは、すべての人に恩恵をもたらします。
これらのような事例の根幹にあるのがデータです。現在、私もあなたもデータに向き合い情熱を注いでいます。しかし、データや分析がクラウドネイティブの世界で実際どのようなことに役立っているのか…弾力性や柔軟性、さらに何よりも信頼できる洞察をこの目で確認できるのは心強いです。

ラフール・パサック:私もまったく同感です。特にこの時期に、私たちが情熱を注いでいることがポジティブな結果をもたらしていると実感できるのは素晴らしいことです。

ジテシ・ガイ:ここまで、私たちにとってとても重要な、医療や食品などの健康分野について言及してきました。さらに、フィットネスについてもディスカッションしませんか?Equinoxは私たちの共通の顧客の1つであり、インフォマティカのIntelligent Cloud ServicesとAWSの分析サービスを活用してクラウドファースト戦略に移行することで最新化を成し遂げました。
私たちの提供する製品がどのようにEquinoxに貢献しているか、お聞かせ
ください。

ラフール・パサック:これは、インフォマティカによるデータ管理やデータ品質プロセスの処理によって、レガシーデータウェアハウスシステムからRedshiftに移行した素晴らしい例ですね。Equinoxでは、まず、フィットネス機器でのデータをキャプチャし、体型を改善し、健康を維持したいと考えている人々に向けてパーソナライズされた環境を構築しました。その後、インフォマティカの製品を使用してデータプロセスを管理し、多数のデータソースに接続します。そのデータをクリーンでキュレーションされた形式に整えることで、Redshiftを使用して高性能分析を行った結果、Equinoxは顧客のエクスペリエンスの向上へとつなげることに成功しました。

インフォマティカとAWSの共同ソリューションにより、Equinoxはデータの読み込み時間を60~70%改善し、リアルタイムレポートではすべてのサービス品質保証(SLA)を満たすことができました。最終的には、これらのような要素がビジネスとしての成果にもつながっています。

ジテシ・ガイ:健康なコミュニティ、健康な食品サプライチェーン、健康な人々。私たちは世界中の問題を完全に解決しているわけではありませんが、このような基本が積み方なって世界平和に到達するのだと思います。
インフォマティカとAWSで結んだパートナーシップの過程で、イノベーションに向けて協力し合い、企業のお客様に成功体験を提供できることに改めて感謝します。両社が提供するエンドツーエンドのクラウドネイティブスタックを使用して、今後もクラウドへの移行や最新なものにし続けられることを楽しみにしています。

本稿は、Intelligent Data Summit for Cloud Data Warehouses, Data Lakes, and Lakehousesシリーズプレミア として放送された対話を書き起こしたものです。サミット内のセッションは全て、オンデマンドでご覧いただけます。


本ブログは2020年8月20日のJitesh GhaiによるThe Value of Cloud Data Management: A Q&A with AWS’s Rahul Pathakの翻訳です。