PIM et intelligence artificielle

S’il y a bien un domaine dans lequel l’Intelligence Artificielle trouve une légitimité naturelle c’est le PIM (Product Information Management). Les PIM, et tout particulièrement Informatica Product 360, ont ces dernières années mis l’accent sur les aspects Omni-Canal et Authoring. Mais les besoins en matière d’automatisation nous frappent dorénavant de plein fouet. La gestion des produits n’y échappe pas et nous voici donc plongés dans l’ère de l’Intelligence Artificielle (IA). Cette vague va chambouler les logiciels, tant l’IA et plus particulièrement le Machine Learning peuvent apporter en matière d’efficacité opérationnelle.

Est-ce vraiment nouveau ?

Pas vraiment ! On en parle beaucoup aujourd’hui, c’est vrai. Ces dernières années le domaine de l’intelligence artificielle – et plus particulièrement le Machine Learning – a fait un grand bond en avant. Médiatiquement, c’est la victoire d’AlphaGo en octobre 2015 qui met le feu aux poudres en devenant le premier programme à battre un joueur professionnel. Incroyable ?  Bien sûr, mais si cet exploit est devenu possible c’est aussi tout simplement parce que les ingrédients sont là : puissance machine, possibilités de stockages, logiciels, etc.

Bref : nous sommes à l’aube de défier Alan Turing et son test, mais bien sûr ce n’est pas l’objet de ce billet.

 

Revenons à nos produits. L’intelligence artificielle se divise en plusieurs disciplines, dont le Machine Learning et le Natural Language Processing (NLP). Si l’on regarde de plus près, ces techniques ne sont pas vraiment nouvelles. Informatica les intègre d’ailleurs depuis déjà plusieurs années dans ses composants (tout particulièrement Informatica Data Quality). Prenons deux cas d’utilisation qui trouveront vite écho dans un gestionnaire de produit (PIM) : le NLP et la classification naïve bayésienne.

Le Natural Language Processing (NLP)

Vous avez des descriptions (longues, courtes, commerciales, etc.) sur vos produits. Vous en avez beaucoup même et malheureusement celles-ci contiennent des informations que vous ne savez pas toujours exploiter. Pire : il arrive que ces données descriptives ne soient pas cohérentes avec vos caractéristiques produit.

Pour résumer : vous avez besoin d’exploiter vos descriptions : le NLP est donc fait pour vous.

Le NLP peut se résumer dans la capacité d’un programme à comprendre le langage humain. Si vous aimez vos assistants personnels (Siri chez Apple, Amazon Alexa, etc.), sachez qu’ils utilisent cette technologie. L’assistant transcrit tout d’abord votre voix en texte. Ensuite il décompose le texte et l’analyse (de manière lexicale, syntaxique, sémantique et pragmatique) afin de vous donner une réponse adaptée à votre demande.

Le champ d’application du NLP étant large, cet exemple reprend le domaine le plus utilisé : la segmentation de texte.

 

Imaginez donc votre solution PIM capable d’analyser chaque description et qui automatiquement :

  • Modifie ou corrige des attributs produits
  • Crée des attributs manquants
  • Affecte la bonne image au produit concerné
  • Classifie automatiquement dans la(les) bonne(s) nomenclature(s)
  • Et bien d’autres services

Bien évidemment, votre solution PIM fait cela de manière automatique et qui plus est, en améliorant la qualité de vos données produit. Imaginez alors votre productivité mais aussi et surtout la fiabilité de ces informations. Dorénavant vous pourrez les diffuser en toute confiance sur vos canaux de vente. En effet, ces tâches sont bien souvent effectuées par des personnes qui, elles, feraient certainement plus d’erreurs que la machine. Grâce au NLP, ce type d’utilisation n’est plus du domaine du rêve et s’intègre et se paramètre naturellement dans Informatica Product 360.

La classification naïve bayésienne

Connaissez-vous le révérend Thomas Bayes ? Ce n’est pas bien grave. Sachez que cet illustre personnage, né en 1702 à Londres, est à l’origine d’une importante loi de probabilité : le théorème de Bayes. Ce théorème définit une probabilité P(Ck|x) par rapport à d’autres probabilités conditionnelles, soit :

Vous n’y comprenez rien ? En fait, ce n’est pas vraiment un problème car Informatica vous permettra son application de manière guidée et 100% graphique.

Résumons : la classification naïve bayésienne est un algorithme de Machine Learning de type supervisé très utilisé pour les problématiques de classification. De manière générale, il est très utilisé pour les problématiques de classification de texte. C’est par exemple ce type d’algorithme qui est utilisé par les serveurs de messageries pour détecter les spams.

Dans le cas d’utilisation dans Informatica Product 360, il vous permettra par exemple de classifier automatiquement dans la bonne hiérarchie vos produits.

Les défis

Évidemment, si Informatica Product 360 vous fournit tous les outils pour mieux traiter vos données produit avec de l’intelligence artificielle, rien n’est complétement magique. Vous allez donc rencontrer des écueils :

  • Vos données produits sont très diverses et proviennent de multiples sources
  • Chaque client a sa manière de classifier (même si des standards existent comme  GS1, ETIM, etc.)
  • Chaque description a sa propre syntaxe et ses propres spécificités
  • Les données produits sont bien souvent multi-langues
  • Etc.

Impossible donc de se soustraire à une bonne étape de Profiling et d’analyse approfondie de vos données avant de mettre en œuvre ces algorithmes de Machine Learning intégrés à Informatica Product 360.

Des nouveaux champs d’application

Le champ d’application de ce type de technologie est large, et même s’il peut d’ores et déjà répondre à automatiser bon nombre de fonctions actuelles, il est intéressant d’envisager des nouveaux champs d’application :

  • La génération de textes via NLG (Natural Language Generation). Pourquoi ne pas étiqueter intelligemment cette fois-ci à partir des attributs ?
  • Le rapprochement (dédoublonnage ?) intelligent se basant sur les descriptions données
  • La recréation de la notion de variance/déclinaison à partir des produits (SKU/items). Il serait intéressant d’utiliser les algorithmes de clusterisation (non supervisés) afin de trouver les articles similaires, les gammes de produits, etc.
  • La création automatique des liens inter-produit (Creating Cross- and Up-Sellings)
  • Créer et gérer automatiquement les SEO à partir de descriptions
  • Etc.

Il est clair que l’intelligence artificielle ouvre des nouvelles portes afin d’automatiser encore plus le PIM. Vous pouvez nous contacter pour en savoir plus. Ou encore mieux, venez nous rencontrer le 16 octobre à la Cinémathèque française (Paris 12ème) !


Benoit Cayla est Principal Sales Consultant chez Informatica

 

Commentaire