Vous aussi, envoyez vos données en « Data Detox » !

Les données sont la nourriture des systèmes d’information et le carburant des entreprises. Ces dernières années, les capacités de collecte, de stockage et de génération de ces données ont augmenté de manière exponentielle. Il s’agit donc maintenant de distinguer, dans cette masse, celles qui sont critiques au métier, nécessaire à l’organisme (l’information) et celles qui seront rejetées ou feront l’objet d’une accumulation malsaine (les déchets ou les graisses). Si ces dernières ne posent plus de problèmes technologiques (Big Data, stockage), elles complexifient la gouvernance ainsi que l’identification et la mise en valeur des informations indispensables. Gare à l’obésité, donc !

Pour l’éviter, je vous propose ici un régime en 5 points :

ecouterEcoutez votre corps !

Où exactement avez-vous mal ? Quels problèmes sur vos données sont les plus critiques pour l’entreprise ? Avant d’entreprendre une quelconque action « Detox », il s’agit d’identifier les erreurs d’alimentation qui doivent être corrigées. Le questionnaire nutritionnel devra ici estimer la qualité des sources de données. L’évaluation de ce type d’indicateurs peut être manuelle (mais fastidieuse), ou automatique, via des outils dits de « profiling ». La flexibilité de ces derniers pour créer, en plus des règles de base (champs vides, types non conformes, etc.), des règles spécifiques au métier, est un avantage primordial pour une découverte en profondeur et à forte valeur ajoutée pour l’entreprise (retro-engineering). C’est également l’opportunité d’en faire une vraie plateforme interactive pour les analystes de données, avec des tableaux de bord « instantanés » mais également un suivi sur la durée. Un outil parfaitement adapté pour mesurer le succès de votre cure « detox » et garder votre motivation intacte au fil du temps…

 

qualité des donnéesEliminez les toxines !

Une fois le diagnostic posé, quels principes actifs pour votre régime ? L’objectif est d’éliminer, ou de limiter, l’apport au sein de l’organisme productif de 6 toxines primordiales : incomplétude, non-conformité, incohérence, inexactitude, duplication et corruption. Là encore, dans de nombreux cas, l’outil informatique vise à permettre le redressement des informations suivant ces 6 axes, tout en limitant le travail manuel d’un opérateur, dédié aux actions à forte valeur ajoutée.

Il est tout aussi important de considérer dans ce processus l’ensemble des modes d’alimentation : l’en-cas restreint, rapide et ponctuel (temps réel), la prise globale, régulière et planifiée (batch) et le grignotage compulsif et ininterrompu (fil de l’eau). Une plateforme de qualité de données d’entreprise, permettant d’adresser de manière cohérente les 6 toxines sur l’ensemble des flux, est la clé d’une « detox » réussie, c’est-à-dire visible à tous les niveaux et valorisante, à l’intérieur comme à l’extérieur.

 

principes sainsAdoptez de sains principes !     

Les cures « detox », même régulières, ne sont pas suffisantes. Eliminer les toxines une fois ingérées par le système d’information est indispensable, mais la réussite passe aussi par un changement de ses habitudes « alimentaires » pour en limiter l’absorption. C’est la nécessité d’adopter de nouveaux comportements vis-à-vis de ses données, d’en contrôler de manière plus efficace leur acquisition, leur gestion et leur utilisation. C’est la gouvernance des données, tout simplement.

Seules la définition et l’application de nouvelles règles permettront d’ajouter un volet préventif au seul volet curatif que représente la majorité des initiatives de qualité de données aujourd’hui. C’est pourtant ce premier volet qui limitera le taux de rechute… Il n’est pas aisé à mettre en œuvre, il suppose des moyens humains non négligeables, un sponsorship exécutif fort, des processus et une organisation nouvelle, indépendante des métiers qu’elle supportera de manière impartiale et transverse. C’est ce schéma de gouvernance, cette charte de bonnes pratiques liées aux données, qui garantira la réalisation optimale de leur potentiel.

 

Attention aux sacrifices !

Les cures « detox » sont fatigantes. Adresser les problématiques de qualité de données, en particulier lorsque l’on n’en contrôle pas l’ensemble des points d’acquisition, est coûteux en ressources et en temps. Comme dans le cadre des régimes alimentaires, il faut s’assurer d’équilibrer le rapport bénéfices/risques. Si la notion de plaisir n’est évidemment pas transposable de la cuisine à l’entreprise, de telles cures sont exigeantes : gare à la fatigue du SI et de ses gardiens !

Il est facile de tomber dans le piège de gérer plus de données que nécessaire, ou à des niveaux d’exactitude et de fidélité qui ne sont pas requis (voir exemple ci-dessous). Les principes de gouvernance visent également à évaluer la pertinence de chaque donnée et le niveau optimal de qualité qui lui est associé, pour mettre en balance sacrifice et bénéfice, coût et ROI. Attention, donc, à ne pas « maîtriser » vos données au-delà de leur valeur pour l’entreprise…

ex - localisation

pourquoi pas un jeuneEt pourquoi pas un jeûne ?

Une idée polémique dans un contexte de course à l’accumulation préventive ou prévisionnelle de données de toutes sortes… Et pourtant, si l’objectif n’est évidemment pas de couper tous les flux d’alimentation, on peut légitimement se demander si l’entreprise n’aurait pas intérêt, de temps en temps, à prendre un peu de recul face à ses données. Pour en analyser, via ses processus de gouvernance, le coût, la finalité et les besoins. Une manière de s’assurer qu’on ne se perd pas dans des données qui, si elles ne sont plus impossible à capturer et conserver, seront autant de perturbations ou d’éléments de déconcentration pour l’IT d’abord et pour le métier ensuite.

L’aspect réglementaire est également à prendre en compte ici, et le jeûne de certaines données peut très bien se voir imposé par les autorités, ou par la pression réputationnelle. Savoir adapter son régime et sa politique à la fois aux besoins et aux contraintes devient essentiel. Autant se priver volontairement (et publiquement ?) des données dont on a estimé qu’elles n’étaient pas indispensables plutôt que d’entrer dans des processus de déclaration, d’acceptation et de purge contraignants.

A méditer… Ou plutôt non, la méditation, c’est une toute autre histoire.

Commentaire