Data Mesh : tout comprendre pour bien se lancer

Ni une technologie… ni un framework.. Le Data Mesh est une nouvelle philosophie en somme, qui a pour objectif de favoriser la réutilisation des données en entreprise, par et pour tous les métiers. Véritable outil d’appropriation de la data, il transforme la façon dont vous employez la donnée pour plus de performance et d’agilité. Décentralisation du système, création de data products, définition de règles… Se lancer dans le Data Mesh, c’est aussi savoir où on met les pieds. Décryptage dans cet article.

Data Mesh : un changement de paradigme

Concept assez récent, le Data Mesh trouve son origine dans la nécessité pour les entreprises de décentraliser les données et de ne plus se reposer sur une unique database qui gère tout au même endroit.
Devant la difficulté à s’adapter à ce modèle, le Data Mesh (ou maillage de données) s’impose comme une approche démocratique de l’organisation de la data, suivant une architecture qui favorise le partage des données et leur utilisation pour l’ensemble des services de l’entreprise. En lieu et place d’un data deck volumineux et puissant, on vise un changement de paradigme avec un ensemble de “briques” individuelles, aux fonctions très précises.

Pour bien comprendre, rien de tel qu’un cas pratique. Prenons l’exemple d’un service marketing, qui a besoin d’insights sur un client. Dans une approche classique de l’architecture de la donnée dans une entreprise, le service s’appuie sur des tableaux de bords issus de la base de données centralisée de l’entreprise pour tirer des informations sur sa clientèle.
Matériellement, c’est un dashboard unique et conséquent, regroupant toutes les données de l’entreprise, de l’historique de commandes d’un client aux entrées comptables. Des colonnes et des lignes d’entrées qui ont de quoi rebuter certains collaborateurs… L’approche Data Mesh bouscule cette organisation en se basant sur le concept de data product : l’équivalent d’un service répondant à un besoin précis dans une architecture micro-service.
Dans notre exemple, le service marketing de l’entreprise n’a plus besoin d’interroger ou d’utiliser une database volumineuse qu’il ne maîtrise pas. Il se repose sur un data product, créé spécifiquement pour l’aider à segmenter la clientèle. Ainsi, d’un système décentralisé, on passe à un système distribué qui entraîne nécessairement des évolutions dans le data management.

Le Data Mesh est fait pour vous si…

… votre architecture est à bout de souffle

Très clairement, la question de passer au Data Mesh dépend du volume de données que vous traitez et des besoins métiers de votre entreprise. En réalité, dès que l’organisation de votre data devient un frein plus qu’un avantage pour vos collaborateurs, c’est qu’il est temps d’emprunter une nouvelle trajectoire. Par définition, les entreprises en croissance gèrent de plus en plus de données. C’est cet exponentiel qu’il faut anticiper le plus tôt possible, car plus le volume de données est important, plus la migration vers le Data Mesh est lourde.
Pour détecter le bon moment pour changer de paradigme, un audit sur votre data est crucial. Il n’y a pas de formule magique : votre choix de passer au Data Mesh doit dépendre de l’utilisation que vous faites de vos données. Et seul un audit complet peut vous donner des bases saines pour prendre des décisions judicieuses.

… vous voulez vous approprier votre data

La décentralisation est une plus-value indéniable de l’architecture Data Mesh. Et ses avantages sont multiples : 

  • L’accessibilité : tous les métiers ont un accès direct au data product qui les concerne et n’ont qu’à maîtriser ce data product unique.
  • La proximité : les utilisateurs de la donnée sont plus proches de leur produit. Ils participent activement à la création du data product qui leur est dédié, sont plus familiers de son fonctionnement et sont donc plus enclins à l’utiliser.
  • L’agilité : la distribution des fonctionnalités de la data permet de faire du scaling et d’adapter chaque data product à des besoins précis. Les équipes techniques dédiées à la création de ces data products gagnent en agilité, de par le fonctionnement même de l’architecture, et en indépendance puisqu’elles s’affranchissent des problématiques liées à un data deck unique.

Avec une architecture Data Mesh, la barrière de la database volumineuse et peu compréhensible tombe. On voit apparaître la notion de domaines, où chaque service ou métier de l’entreprise profite de la donnée dans un environnement adapté, avec des termes techniques et des éléments de langage déjà maîtrisés. Et en cas de nouveau besoin, une équipe dédiée au domaine peut créer un nouveau produit rapidement en un sprint, sans passer par une étude de la construction de la database, une recherche des données pertinentes etc.

… vous êtes prêt à relever le défi de l’implémentation

Passer au Data Mesh signifie souvent qu’il faut mettre en place une migration. L’enjeu n’est donc pas l’implémentation de la nouvelle architecture en elle-même, mais bien la gestion de la transition. De manière générale, vous passez d’un modèle monolithique à un modèle hybride, où l’ancienne architecture centralisée est maintenue pendant un temps et où commencent à émerger les premiers data products.

Il n’y a pas de processus ou de framework précis pour transformer son architecture de données. Très adaptable par définition, le maillage de données dépend nécessairement de l’entreprise, de ses enjeux et des personnes qui la composent. C’est donc une période de consultations de toutes les parties prenantes, un challenge humain avant tout.

La gouvernance des données, le pré-requis indispensable

S’il n’y a pas d’étapes précises à suivre pour passer au Data Mesh, la définition de règles est obligatoire pour réussir. Derrière l’idée de décentralisation de la donnée apparaît le risque d’introduire des divergences entre les équipes et les services. D’où la nécessité d’anticiper cette distribution et de construire un ensemble de règles en collaboration avec les parties prenantes.
C’est le mandat de la Data Gouvernance et un pré-requis indispensable. Vos collaborateurs ont besoin d’être sûr de trouver la donnée, d’être sûr de la qualité de cette donnée. Le rôle de la gouvernance est d’accompagner la transition portée par l’équipe technique. L’objectif est d’éviter de générer un système de silos de données très problématiques, sans connaissance de qui les maintient et comment ils sont maintenus.
La gouvernance assure ainsi le lien entre les équipes (appelées data squads).

Prenons le cas d’usage maintenant familier des entreprises : la protection des données et le RGPD. Les enjeux sont multiples : 

  • Comprendre et prendre en compte le cadre réglementaire
  • Comprendre la notion de “donnée sensible”
  • Identifier les données sensibles dans l’entreprise
  • Définir des règles à appliquer à ces données sensibles

Et face à ces enjeux, plusieurs acteurs de l’entreprise sont concernés. L’interprétation des lois relèvent du service juridique ; les défis de cybersécurité concernent les équipes techniques. Et c’est le rôle de la gouvernance que d’être un facilitateur et de tisser des liens entre les métiers pour traiter globalement et correctement ces données sensibles.

Mettre en place une architecture Data Mesh dans son entreprise est un réel changement de paradigme, auquel il faut préparer vos équipes et qui doit s’adapter à votre utilisation de la donnée. Pour anticiper vos besoins métiers, il est important de procéder à un audit organisationnel et technique, qui permettra de déterminer la meilleure façon d’entreprendre avec succès votre projet data.