データ品質によって消費財業界で勝ち抜く

貴重な企業資産であるデータの価値を左右するのは「データ品質」

この2年間を通して多くの業界が混乱に陥りましたが、消費財(CPG)を生産する産業もその例外ではありません。CPG企業は、供給と生産の問題、流通と運搬の問題、そして消費者の購買行動の変化など、様々なことへの対応を強いられてきました。それと同時に、デジタルトランスフォーメーションの取り組みに多額の投資を行うことで、サプライチェーンの最適化およびレジリエンスの構築、製品イノベーションの推進、購買行動への影響、新たな市場機会の獲得、顧客のニーズを満たす製品の正確な調整、リスク管理などに役立てています。こういった作業はすべて、マージンを維持および拡大しながら行われているのです。

デジタルトランスフォーメーションの取り組みには大きな期待が寄せられていますが、目標達成の足かせとなる大きな課題が存在することも事実です。複数のクラウドやハイブリッド環境におけるデータの蔓延、断片化、分散化は、今やニューノーマルとなっています。世界経済フォーラムによると、業界全体の組織の80%以上がデジタルトランスフォーメーションの取り組みを加速することを計画していますが、その中でも70%は目標を達成できていない状態です。1

メーカーは、自社システム内の豊富なデータに加え、取引先からの膨大なデータを活用することで、製品開発、需要計画、調達、流通、販売およびマーケティングなどの意思決定に反映させることができます。ただし、これらはすべてデータ(より正確には、高品質のデータ)があって初めて成立します。

ここでは、製品とサプライヤのマスターデータに関するいくつかの例を見てみましょう。


製品マスターデータの不備がもたらす影響


製品マスターデータに関連するデータ品質が低かった場合、ビジネスへどういった影響が及ぼされるかを図1でご説明しています。これらはそれぞれ、コストの増加、収益の減少、市場投入までの期間、および生産性の低下と直接的に関わっています。

図1:データの欠陥がサプライチェーンに与える影響

多くの企業は自社のデータを過信する傾向にあり、サプライチェーンを動かしているデータの品質や潜在的な影響について見直そうとしません。

こういった場合の改善策として挙げられるのは、表1に示すように、達成できなかった場合の潜在的な影響と業務方針とを結びつけることです。

各影響のコストは、ビジネスケース開発の一環として評価され、その評価は、ベースラインの測定値だけでなく、改善のための目標値も提供します。

表1 潜在的な影響と業務方針の関連付け


#4の “All orders must be deliverable.(すべての注文は配達可能でなければならない)”という業務方針について考えてみましょう。

商品IDの欠落、不正確な商品説明、および異なるサブシステム間の不整合などがあった場合、その影響で注文された商品を配送できない可能性が高まります。これに対して、商品IDがきちんと確認できる状態であること、商品説明が正確であること、アプリケーション間におけるデータの整合性を維持することで、注文への対応を改善することができます。


アナリティクスとレポートから重要な洞察を得る


すべての企業データは、分析することで大きなメリットを得ることができます。つまり、データ主導の洞察を活用し、ビジネス、顧客、およびプロセスをよりよく理解することが大切なのです。

こういった必要性が推進力となり、新世代の技術とともにアナリティクスの分野は爆発的に発展してきました。

今日のアナリティクスや機械学習でメリットを得るには、1つのデータストアや部門に関するサイロ化された情報を超えたところからの視点を持つ必要があります。つまり、異種社内外のさまざまなデータソースを組み合わせて、サイロ化されたビューでは得られなかった洞察を生成するのです。

また、機械学習とAIアルゴリズムを適用して行動パターンを認識し、消費者の関心を特定して推奨事項を提供し、イノベーションを推進することも大切です。そのため、アナリティクスに関する取り組みを成功させるにはデータ品質が非常に重要となってきます。サプライヤから小売業者、内部システムまで、さまざまなデータソースにわたる洞察をまとめるには、結合されるデータの信頼性を確保が必要です。

以下の表2は、CPC企業において低品質なデータが原因となって発生する可能性がある、典型的な問題の例を示しています。


表2:顧客の注文


上の表を見て、どの小売業者・国の売り上げがトップなのか、どの製品が最も多く売れたかを容易に特定することができるでしょうか?

このデータをクレンジングおよび標準化し、企業のダッシュボードでどのように見えるかを比較してみましょう。

ここで、一般的なCPG企業が管理する膨大な数のSKUにオファー、サイズ、言語といった、製品に関する複数のバリエーションを追加すると、問題は飛躍的に複雑になります。


機械学習の改善に向けてデータをすばやく準備する


多くのCPG企業は、顧客や顧客行動の変化について、そして移り変わる市場について、社内外から得られる膨大なデータを活用するために、機械学習やAIへの投資を行っています。

“garbage in, garbage out,(ゴミからはゴミしか出てこない)”ということわざもあるように、データのクレンジングと標準化が機械学習(ML)の前提条件となるのはそのためです。

データの品質が向上すると、データを誤解することが減り、モデルのパフォーマンスが改善されます。機械学習によって良質な予測モデルを得るためには、高品質なデータが不可欠です。

ただし、AIとMLの高品質データの取得、準備、維持は、想像以上に難しい作業です。

モデルのトレーニングに必要なデータは、さまざまなソースから複数の形式で、そして多くの場合、膨大な量で提供されます。これにより、データ品質に関する多くの問題が引き起こされ、AIおよびMLモデルに影響を与える可能性があります。

そこで、データ品質にあるさまざまな側面を分類してみましょう。


・完全性-欠落している、もしくは使用できないデータは?

・適合性-非標準の形式で保存されているデータは?

・一貫性-矛盾する情報を提供しているデータは?

・正確性-不正確、もしくは古くなっているデータは?

・重複-重複しているデータレコードは?

・保全-重要な関係のつながりが欠落しているデータは?

・範囲-どのスコア、値、および/または計算が範囲外になっているか?

・データのラベル付け―データは正しいメタデータでラベル付けされているか?


完全なリストではありませんが、これらは私が見たAIおよびMLモデルで最も広く使用されているものです。お客様が使用した他の側面としては、厳密性、信頼性、適時性、継続性などが挙げられます。

この例を考えてみましょう。ある企業がMLモデルで使用するために、国ごとのデータを取得します。そのデータから作られたのは、以下のような統計でした。



これは、一体どういうことでしょうか?このデータは、適切なフィルターが前もってかかっていなかったか、複数の場所から取得されたものだったのです。結果として、不一致が発生し、MLモデルの結果にも影響を与えます。

教師のいない学習の場合は、AIがデータに潜り込んで自動で物事を把握するので、データの品質がさらに重要となります(データ品質に関する問題を追跡することが非常に困難な「ブラックボックス」アプローチ)。


貴重な企業資産であるデータの価値を左右するデータ品質


データはあらゆる場所に存在します。そのため、データ品質に関することは、プロジェクトチームの問題やサイロ内だけではなく、戦略的イニシアチブとして考えるのが最適と言えます。

インフォマティカは、組織内におけるすべての主要な関係者が効果的に連携して、粗悪なデータを特定し、迅速に修正できるようにするためのサポートを行います。Informatica Intelligent Data Management Cloudを使用すると、以下のことが可能になります。


・アプリケーションのデータをプロアクティブにクレンジングし、クリーンに保つ

・データ品質とデータガバナンスに関する責任を共有する

・エンタープライズデータマネジメントへの信頼と信頼を構築する


インフォマティカは、長年にわたってお客様と協力してきた経験を活かし、データ品質の問題を特定・解決します。Informatica Cloud Data QualityはInformatica Intelligent Data Management Cloudの一部であるため、ITコードの追加や開発を行うことなく、データ品質の問題をすばやく特定し、解決することができます。その結果、セキュリティ、信頼性、およびバックアップを活用するできるため、追加のインフラストラクチャへ費用を割く代わりに、業務の卓越性へ投資することができます。また、ビジネスユーザーは、再利用可能なデータ品質ルールを合理的かつ協力的な環境で容易に指定、検証、テストすることができます。

Cloud Data Qualityの30日間無料トライアルで、データ品質に関する問題の発見と修正を今すぐ始めましょう。インフォマティカの提供する、CPG企業向けのデータ管理ソリューションの詳細については、ホワイトペーパー“Capitalize on Emerging Consumer Opportunities in CPG.(CPGにおける新たな消費者の機会を活用する)”をご覧ください。

1 https://www.weforum.org/agenda/2021/01/here-s-how-to-flip-the-odds-in-favour-of-your-digital-transformation/




本ブログは、2022年1月17日のDONAL DUNNEによるWinning in Consumer Packaged Goods with Data Qualityの翻訳です。