ファイザー社がクラウドでデータ統合とETLにこだわる理由

コロナ感染拡大以降、ファイザー社の最新医療は、日々ニュースとなっています。

しかし、同社の最先端科学研究の背景には、データ管理の革新的なアプローチがあります。これは、創薬、テストから大規模製造、物流まで医薬品バリューチェーンのすべてのステップで、信頼できる洞察が得られるようにするためのものです。

先日開催されたインフォマティカとSnowflake社のCloud Modernization Summitでは、ファイザー社で20年の経験を持ち、ETLの設計、開発からデータウェアハウスやビジネスインテリジェンスのプロジェクトまで、データおよび分析プログラムの先駆者であるJohn Leone氏のお話しを伺うことできました。

最近では、ファイザー社がクラウドでアナリティクスプラットフォームを最新化する取り組みの最前線にいらっしゃる方です。

今回の対談では、この最新化の背景となった要因、自動化とクラウドネイティブな統合のメリット、データ管理をPowerCenterからインフォマティカのインテリジェントクラウドサービス(IICS)に移行した際のベストプラクティスについて伺いました。以下のインタビュー内容は、分かりやすくまとめて編集しています。


Pratik Parekh:ファイザー社でのご自身の役割と、データに関するビジョンについてお聞かせください。


John Leone氏:私はファイザーデジタルの一員で、特にデータアナリティクスサービスをグローバルに提供するグループに所属しています。私たちは、がん、眼科、ウイルス学など、ヘルスケアのほぼすべての重要な領域で医薬品をより早く世に送り出し、患者様や医師に関心を持ってもらい、あらゆる分野で創薬と開発のデジタル化を実現するために努力しています。

すべての取り組みには、データとアナリティクスが必要です。適正なデータを適正なユーザーに適正なタイミングで提供することです。これには御社やSnowflake社、現在開発中のPfizer Insightsと呼ばれる大規模イニシアチブのようなカスタムビルドソリューションまで、あらゆるものが含まれます。


Pratik Parekh:クラウドの最新化を推進する理由について教えてください。


John Leone氏:1つはコスト削減です。私達は以前にも増してスピーディーに、より少ないコストで多くのこと行えるように心がけています。俊敏性、革新性、拡張性という3つのクラウドの課題があります。仕事のやり方を完全に変え、ITからソフトウェア開発に移行し、従来とは違う人材を採用し、ファイザーのリソースをどのように拡張させるかを考えています。本質的には自社の改革をしています。

技術的な観点で言うと、当社は何年も前からアナリティクス分野でクラウドファーストでしたが、オンプレミスのポートフォリオの最新化に着手しているところです。

今後数年間で、できる限りクラウドオンリー企業になることが目標です。複雑なビジネスプロセスや製造現場には、常にオンプレミスのソリューションが必要です。当社は常にハイブリッドでありながら、クラウドネイティブな企業を目指しています。


Pratik Parekh:その経験を通して、インフォマティカとの関係はどのように変化したのでしょうか?


John Leone氏:弊社は過去20年間、PowerCenterを使ってきました。これは今でも多くのコアビジネスプロセスを支えており、おそらく60以上のPowerCenterアプリケーションが稼働しています。そして毎月数千億行を処理しています。

一方で、IICSも長期にわたって使用してきました。2015年からSalesforceとの統合ためにIICSを導入していますが、使いやすいツールです。ここ数年は製造業、商業、受注管理において、より高度で複雑なソリューションを導入しています。


Pratik Parekh:製造分野のユースケースにおいて、クラウドへの移行はどのようなものだったのでしょうか?


John Leone氏:PGSはファイザーグローバルサプライチェーンの略で、私たちの製造および流通分野です。

数年前、私たちはデータ分析をデータレイクに集約することを目指し、現在順調に進んでいます。

特に最近では、Snowflakeを採用し、オンプレミスでのデータ分析をクラウドに移行することになりました。このデータウェアハウスは以前からありますが、何千ものマッピングやセッション、ワークフローが存在しています。

アプリケーションとビジネスロジックに何年も投資してきたのです。これをクラウドに移行するのは、コスト面でもスケジュール面でも大変なことでした。

数カ月前、クラウドデータウェアハウスの最新化サービスとしてインフォマティカと契約させていただきました。評価させて頂いたところ、ワークフローとセッションのマッピングのほぼ99%が、インフォマティカのツールで自動的に変換されていることが分かりました。

また、クラウドデータウェアハウスの最新化サービスで、ほぼすべてのコードを変換することもできました。このようなツールの提供だけでなく、サービスも受けさせて頂けることが安心につながります。ツールやIICSへの変換で問題発生した場合、助けて頂けるのです。


Pratik Parekh:今回のことで、どのように評価されますか?


John Leone氏:弊社のソリューションには複雑なものが多いのですが、特に何年も前からあるものはもっと複雑です。ビジネスロジックを忠実に維持すること、これが第一のポイントです。インフォマティカのIICSコードをテストし、実行可能かどうか、再利用可能かどうかの基準が満たされたのが、弊社にとっては大きな成果でした。そして、コード変換がなされ、想定していたスケジュールよりも早く、弊社の負担が軽減されました。


Pratik Parekh:たくさんの選択肢がある中で、エコシステムのパートナーに何を求めていらっしゃいましたか?


John Leone氏:Snowflakeは戦略的技術として捉えています。データ処理、データ共有、またはデータの複製を拡張することです。弊社が目指す最新化の実現に役立ち、メンテナンスも不要です。

IICSはSnowflakeとの連携が素晴らしく、データのロードやアンロード、ロジックをSnowflakeへ素早く投入できます。これは本当に親和性があります。IICSをデータ統合ツールとしてお勧めする理由は、ほかにもあります。クラウドに依存しないことです。今はAWSですが、GoogleCloud、Azure、そしてSnowflakeでも対応可能なことです。ですから、弊社とともに成長し、マルチクラウドに対応し、将来を見据えたツールが必要なのです。Pratik Parekh:開発者の従業員は、PowerCenterからIICSへの移行はどのように行われたのでしょうか。


John Leone氏:クラウドへの移行は非常にスムースでした。PowerCenterとOracleからIICSとSnowflakeに移行していました。ソースも、実際のソースシステムから製造データレイクへと変化していきました。しかし、コンセプトは似ていますし、マッピングやセッションもあります。GUIも見慣れたものに感じられました。PowerCenterではコーディングが必要だった繰り返しの作業でしたが、IICSではタスク主導やウィザードベースです。多くの点で開発プロセスを簡素化できます。

PowerCenterは昔からあって、さまざまな使い方できる機能がありますが、それらジョブをIICSに変換するにあたり、問題なくマッピングすることができました。また、研修を行う回数は少なかったです。これはIICSの素晴らしい点で、PowerCenterからIICSへの移行が非常に簡単であるということが証明されていると思います。

Pratik Parekh:PowerCenterからIICSへの移行を目指している方々へ、共有したい事柄はありますか。


John Leone氏:大きな点としては、プロジェクトに想定外の事態が発生したときのことを考えて時間を見積もることです。何か問題が生じた場合、それを解決する必要があります。また、一般的に、すべてがPowerCenterからIICSへの移行に適しているわけではないということも心に留めておく必要があります。プロジェクトによっては書き換えが必要なこともありますし、一時的にクラウドで動作させる必要があるソリューションであれば、応急処置的に使えるかもしれません。ただし、多くのビジネスロジックがあり、オンプレミスのソリューションに多くの投資をしている場合は、クラウドに移行する以外に方法はないと思います。市場では他に選択肢がないのです。書き換えにはコストがかかり、何年もかかります。


クラウド移行への道を加速する方法を学びましょう

データ主導のトランスフォーメーションについてもっと知りたい方は、弊社のライフサイエンスのページをご覧ください。臨床および製薬業界のリーダーたちがAIを活用したデータマネジメントによって行っている研究開発や、サプライチェーン、事業の取り組みをどのように改善しているかご確認頂けます。

また、クラウドデータウェアハウスへの移行を検討している方は、その価値がすぐに分かり、PowerCenterをIICSにマッピングする際にリスクなく自動化できるPowerCenterモダナイゼーションリソースセンターで、移行を開始できます。


本ブログは2021年11月30日PRATIK PAREKHによるWhy Pfizer Cares About Data Integration and ETL in the Cloudの翻訳です。