Votre base de données clients est le système qui permet de stocker et d’organiser de manière structurée l’ensemble de vos données clients. Socle de l’analyse et de l’activation, son rôle est fondamental dans votre capacité à exploiter vos données clients.
Problème ? La multiplication des interactions avec vos clients, tout au long du parcours d’achat rend cette démarche plus complexe. Vos données clients sont stockées dans des systèmes et des formats différents, ce qui implique un travail d’unification et de normalisation en amont de leur exploitation d’un point de vue marketing.
A quoi correspond exactement la notion de base de données clients ? Quels sont les principaux enjeux associés ? Vers quels outils se tourner pour poser les bases d’une bdd clients saine et scalable ?
On répond à toutes ces questions dans le guide ci-dessous ! Bonne lecture.
- L’essentiel à retenir sur les bases de données clients
- Pour commencer, c’est quoi une base de données clients ?
- Les enjeux autour des bases de données clients
- Comment construire une base de données clients ?
- Zoom sur les logiciels de bases de données clients
- Pourquoi est-il important de garder le contrôle des données des clients ?
- Les 3 dimensions clés du contrôle des données
- Absence de contrôle des données = risque
- Comment la stack data moderne permet de reprendre le contrôle de vos données ?
- Comment nettoyer sa base de données clients
L’essentiel à retenir sur les bases de données clients
- Une base de données clients est un système permettant de stocker et organiser les données clients de l’entreprise afin de mieux connaitre ses clients et ainsi améliorer vos performances. Des données clients fiables et structurées servent de socle à l’analyse et à l’activation grâce à des campagnes marketing plus performantes.
- Pour être exploitable, une BDD doit être bien organisée, cohérente et mise à jour régulièrement. Tout l’enjeu d’une bonne BDD est de centraliser les données constamment tout en les gardant les plus à jour possibles dans un environnement intégralement sécurisé et structuré.
- Construire sa BDD implique de déterminer les objectifs, identifier les sources des données et adopter la solution logicielle adéquate à ses besoins.
Pour commencer, c’est quoi une base de données clients ?
Définition d’une base de données clients
Une base de données clients est un système servant à stocker et à organiser de manière structurée les données clients de l’entreprise.
Mais qu’est-ce que sont concrètement les données clients ? C’est ce que nous allons voir maintenant. Un peu plus loin dans l’article, nous vous présenterons les principaux systèmes possibles pour organiser ces données clients et construire votre base de données clients.
Parce qu’on définit aussi une chose par sa finalité, une BDD clients a deux types d’usage principaux étant :
- L’analyse / la Business Intelligence / la connaissance client : la finalité principale d’une BDD client est de mieux connaître ses clients. Entre autre, les données de la BDD servent à alimenter des reportings, qui peuvent avoir des fins stratégiques / business mais aussi comptables / financières / juridiques…
- L’activation : une BDD Clients peut être utilisée par les équipes marketing, les commerciaux, le service client pour personnaliser les actions, mieux cibler les clients et ainsi être plus compétitif.
Quelles données contient une BDD Client ?
Comme vous pouvez l’imaginer, les données clients incluent l’ensemble des données liées au profil de chaque client. Par exemple, une entreprise connait les données minimum requises comme le nom, le prénom, l’âge, le sexe, l’email, l’adresse et le téléphone de chaque client. Pourtant, les données clients sont beaucoup plus riches que des simples données personnelles ou de contact comme celles-ci, car les données clients incluent aussi l’ensemble des données transactionnelles (historiques d’achats, informations de facturation, etc.), les données d’engagement web / marketing de chaque client et bien d’autres encore.
En bref, les données clients sont l’ensemble de données qui, combinées, permettent d’avoir une compréhension précise et solide de chaque consommateur (profil, comportement d’achat, parcours client…). Pour avoir les idées un peu plus au clair, on peut regrouper ces types de données en plusieurs familles :
Si on a surtout parlé de données clients B2C jusqu’ici, il est important de garder en tête que la typologie B2B est assez différente. En B2B, on distingue deux niveaux : le client-entreprise et le client-interlocuteur dans l’entreprise. Les données clients relatives à l’entreprise, aussi communément appelées « données firmographiques », sont une spécificité du B2B et incluent des informations comme le SIRET, l’effectif salarié, les données financières, le secteur d’activité, etc. Bref toutes les infos qui permettent de qualifier une entreprise.
Les caractéristiques d’une bonne base de données clients
Pour considérer qu’une BDD est solide, elle doit remplir les critères suivants :
- La complétude : pour maximiser la pertinence de votre BDD, vous devez d’abord vous assurer de bien identifier les champs dont vous aurez besoin . Ces champs peuvent inclure, par exemple, des informations telles que le nom, l’adresse e-mail, l’adresse postale, le numéro de téléphone, l’âge, le sexe, le domaine d’activité, etc. Assurez-vous ensuite de bien les compléter afin de bien cerner le profil de chaque client.
- La vision clients unifiée : intrinsèquement liée à la complétude des informations clients, une vision clients unifiée implique la constitution des fiches clients 360. Dans ce contexte, la BDD doit centraliser le maximum de données clients (indice de complétude) mais de façon intelligente et ordonnée (gare aux doublons !). Ainsi, n’importe quelle équipe de votre entreprise pourra accéder et utiliser rapidement l’ensemble des informations collectées sur le client pour personnaliser au mieux le service.
- La propreté : pour être exploitables, les données doivent être régulièrement mises à jour et nettoyées. Il faut également faire attention au format qui doit être uniformisé pour chaque catégorie. La propreté passe également par la cohérence entre les informations : vos données ne doivent pas entrer en conflit en présentant par exemple des informations contradictoires.
- L’exploitabilité : que ce soit pour faire des analyses ou améliorer la relation clients, l’intérêt d’une BDD clients réside dans ce qu’on en fait. Cela implique donc une interface user-friendly, adaptée pour les utilisateurs métiers (préférer ici une Customer Data Platfom à un data lake) avec une segmentation de données bien réfléchie (par exemple, par zone géographique, par centre d’intérêt, etc.). L’exploitabilité de la BDD passe également par la mise en place de flux / connecteurs entre la BDD et les outils utilisés par les équipes.
- La sécurité : bien gérer sa BDD réside également dans la bonne gestion de son accès. Les droits d’accès utilisateurs doivent être accordés uniquement aux équipes susceptibles d’en avoir besoin. Par ailleurs, des mesures doivent être mises en place pour lutter contre la perte et la fuite de données, mais également pour analyser régulièrement le niveau de qualité des données.
- Le respect des règlementations : une base de données étant, par définition, un nid d’informations personnelles sur ses clients, elles se doivent de respecter les différentes réglementations portant sur les données personnelles comme la Loi Informatique et Libertés (LIL) et le Règlement général sur les données personnelles (RGPD).
Votre BDD réunit toutes ces caractéristiques ? Il ne vous reste plus qu’à l’exploiter intelligemment pour en récolter les fruits !
Les enjeux autour des bases de données clients
Comment centraliser la quasi totalité des données clients ?
Dans un contexte d’explosion des données comportementales web, beaucoup d’entreprises peinent à articuler intelligemment ces données et ensuite les exploiter.
L’idée de la centralisation des données est donc de donner une vision exhaustive de chaque client, afin de mettre en place les actions marketing les plus pertinentes possibles et adapter son discours en fonction de leurs préférences / intérêts / comportements d’achat.
Pour centraliser intelligemment ses données, il suffit de :
- Déterminer le périmètre de ses données : chaque entreprise brassant un nombre colossal de données internes, externes, privées et publiques, la première étape est donc d’identifier toutes les sources disséminées au sein de l’organisation. Ces silos de données peuvent prendre la forme de logiciels CRM et ERP, de systèmes hérités ou encore de tableurs.
- Articuler la gestion des données autour d’objectifs concrets : pour éviter de se laisser submerger par la quantité de données disponibles, il est en général recommandé de déterminer au préalable les enjeux professionnels que vous souhaitez atteindre et les problèmes que vous souhaitez résoudre.
- Fédérer ses collaborateurs : le succès d’une stratégie de gestion des données passe par la mobilisation des équipes à tous les niveaux. La gestion des données n’étant plus le domaine réservé des services informatiques et financiers, vous devez sensibiliser vos collaborateurs à la qualité des données puisque ce seront eux qui collecteront et exploiteront au quotidien ces données.
Si les logiciels CRM ont longtemps été incapables de gérer les données issues du digital, les Customer Data Platforms se sont positionnées comme une alternative pertinente et complète.
Comment créer une vision clients unifiée ?
On entend concrètement par une « vision clients unifiée » :
- La capacité à dédupliquer / dédoublonner les données importées des différences sources de l’entreprise (les interactions des clients avec votre entreprise, les données de navigation sur votre site web, les interactions sur les réseaux sociaux, les transactions d’achat, les données de comportement, etc.).
- La capacité à pouvoir visualiser simplement, dans une fiche client, et exploiter l’ensemble des données relatives à un client.
Dans le cas où vous avez plusieurs systèmes hétérogènes, il existe des solutions pour assurer l’unification de vos données clients :
- Choisir les produits d’un même éditeur, de sorte que tous les programmes soient intégrés nativement.
- Développer votre propre code pour forcer les systèmes à communiquer entre eux.
- Utiliser des interfaces de programmation d’application (API) : ces solutions permettent à deux sources de données hétérogènes de se « parler » le même langage informatique, afin d’échanger des informations sans avoir à copier des données.
Chaque approche a ses avantages et ses inconvénients : le tout est de savoir laquelle vous conviendra le mieux en fonction du profil de votre entreprise et de l’industrie dans laquelle elle évolue.
Comment assurer la data quality dans le temps ?
Assurer la data quality de sa BDD, c’est tout sauf sorcier ! Comme mentionné plus haut, une bonne BDD centralise des données à jour, pertinentes et cohérentes.
Pour assurer la data quality de sa BDD dans le temps, il suffit donc de la maintenir régulièrement à jour. Les données, par définition, se détériorent pour l’essentiel d’entres elles avec le temps : certaines deviennent obsolètes. Par exemple, un client n’aura pas forcément les mêmes centres d’intérêt à 20 ans qu’à 40 ans !
Pour assurer cette mise à jour régulière de ses données, privilégiez la mise en place d’un process rigoureux pour maintenir l’exploitabilité de votre BDD clients.
Assurer la data quality de sa BDD implique donc deux choses : un process permettant son exploitabilité, ainsi que des outils permettant de la nettoyer régulièrement.
Comment limiter la dépendance aux profils tech pour modifier la BDD ?
Pendant longtemps, la gestion d’une BDD était compliquée, dû au fait que celle-ci était maintenue par la DSI (Direction des Services d’Information). Ainsi, l’accès aux données par les différentes équipes était compliqué, ce qui rendait le système très lent et peu user-friendly.
Aujourd’hui, les nouvelles technologies permettent de déléguer la gestion d’une BDD aux utilisateurs métier (marketing, sales, etc.), grâce à l’avènement de BDD no code / low code, avec notamment l’émergence de Customer Data Platforms. Si les paramétrages initiaux se font encore par la DSI / l’IT, sa gestion quotidienne est assurée par les utilisateurs métier qui deviennent ainsi autonomes dans la manipulation des données.
Ce nouveau système permet donc une exploitation optimisée de la BDD !
Comment s’assurer que la BDD est sécurisée tout en facilitant l’exploitation par les équipes marketing ?
Déléguer la gestion d’une BDD aux équipes métier est une bonne chose, car elle permet une plus grande autonomie et donc une plus grande efficacité des utilisateurs métier.
Néanmoins, ceci n’est pas sans risque : qui dit plus de gestionnaires potentiels dit donc un plus grand risque de mauvaises manipulations, de désorganisation de la base, des soucis de cohérence… Pour contrer cela, il s’agit donc de mettre en place des process solides / des gardes fous pour s’assurer que la BDD reste propre, cohérente et sécurisée.
Comment construire une base de données clients ?
La construction d’une base de données clients est en fait assez intuitive. Il suffit, pour cela, de suivre quelques étapes essentielles.
#1 – Définir les objectifs de la BDD Clients
Définir les objectifs de sa BDD Clients est essentiel puisqu’elle permet de déterminer son utilisation future. Par conséquent, les objectifs détermineront les données à collecter et les actions à entreprendre pour ce faire.
Les objectifs de la BDD client peuvent être variés, mais ils ont tous en commun l’objectif final d’améliorer et de développer les relations avec les clients. Pour identifier ces objectifs, on peut envisager de déterminer :
- Les objectifs globaux de l’entreprise : pour être efficace, la BDD client doit être alignée avec les objectifs globaux de l’entreprise. Il est donc important de déterminer les objectifs généraux de l’entreprise (augmentation des ventes, amélioration du service client, etc.).
- Les objectifs spécifiques de la BDD client, qui doivent être liés aux objectifs globaux. Par exemple, l’objectif spécifique pourrait être d’augmenter la fidélité des clients en améliorant leur expérience d’achat.
- Les critères de la BDD client : on entend par « critères » les informations à collecter pour alimenter la BDD client. Ils peuvent inclure des informations de base telles que le nom, l’adresse et l’adresse e-mail du client, ou des informations plus détaillées telles que les achats précédents du client ou ses préférences.
Lorsque l’on fixe les objectifs de sa BDD client future, il est aussi important de se poser quelques questions comme :
- Quoi : quels indicateurs de performance vais-je regarder ? (taux de conversion, NPS, taux de réachat…)
- Quand : sur quels points de contacts vais-je interroger mes clients ? (en sortie de site, sur les pages produits…)
- Qui : quelles sont les données dont je vais avoir besoin ? (URL de la page, ID client, magasin concerné…)
- Comment : quel dispositif vais-je mettre en oeuvre afin de collecter ces données ? (questionnaire post-achat, pop-in en sortie de site, questionnaire post-contact…
#2 – Définir les données qu’elle va accueillir / les sources de données
Une fois les objectifs identifiés, il est important de définir les sources de données pour les collecter de manière efficace. Parmi les sources, on peut imaginer des formulaires en ligne, des bons de commandes, des jeux concours, des enquêtes, etc.
De manière générale, pour obtenir des informations sur vos clients, il vous faut être proactif. Le recueil de données doit être fait soit discrètement, soit avec incitation mais toujours avec discernement. Si vous communiquez un sondage à un client afin de mieux le connaitre, gardez à l’esprit que vous êtes en train de lui demander quelque chose. Préférez alors une formulation agréable pour votre client, comme par exemple : « Afin que nous puissions en apprendre davantage sur vous et vous fournir un service plus adapté à vos besoins personnels, veuillez remplir… ». Vous pouvez également envisager d’offrir une réduction sur leur prochain achat à vos clients récurrents s’ils remplissent votre enquête ou participent à votre jeu concours.
Les sources sont multiples, il faut juste savoir comment bien les utiliser !
#3 – Choisir une solution logicielle adaptée
Savoir reconnaitre une solution logicielle adaptée à vos besoins n’est pas toujours chose facile. Pour vous faciliter la tache, nous vous conseillons de prendre en compte ces quelques critères de base :
- La notoriété de la plateforme, qui donnera un indicateur sur ses performances.
- La pertinence et la richesse des fonctionnalités de base de données clients en fonction de vos objectifs et de l’industrie dans laquelle votre entreprise s’inscrit.
- La facilité d’utilisation de l’outil (ergonomie, graphisme).
- La possibilité de se connecter depuis différents appareils : ordinateur, tablette, smartphone…
Encore un peu perdu ? Voici d’autres critères un peu plus poussés qui pourront vous aiguiller dans votre choix :
- L’évolutivité de la plateforme : plus vous collectez de données clients, plus votre entreprise se développe et vos besoins évoluent. Assurez-vous que la solution choisie puisse se synchroniser et s’intégrer avec d’autres outils essentiels au développement de votre activité. Une solution basée sur le Cloud est souvent recommandée.
- La protection de vos données : assurez-vous que le logiciel de base de données clients propose un système de gestion des droits d’accès et plusieurs méthodes de protection des données (suppression automatique en cas de piratage, sauvegarde automatique…).
- La cohérence de vos données et la facilité de leur utilisation : vous serez amené à collecter différentes données provenant de différentes sources, il faut que le logiciel choisi puisse les supporter.
Nous reviendrons un peu plus tard dans l’article sur les différents logiciels disponibles pour la tenue de sa BDD clients.
#4 – Connecter les sources de données à la BDD pour faire remonter les données dans la BDD
L’un des enjeux principaux d’une bonne BDD est de centraliser l’ensemble des informations provenant de sources multiples.
Après avoir extrait des données pertinentes, il vous faut choisir une méthode d’intégration de ces données avant de les connecter à la BDD. Les méthodes peuvent varier en fonction du système utilisé pour stocker la BDD et des fonctionnalités disponibles. Parmi les méthodes que l’on retrouve couramment, on peut envisager l’utilisation d’une API (Application Programming Interface soit une interface de programmation), l’importation de fichiers CSV ou encore l’intégration avec des outils ETL (Extract, Transform, Load).
Une fois la méthode d’intégration choisie, connectez les sources de données à la BDD. Cela implique généralement la configuration des paramètres de connexion, tels que l’adresse IP, le nom d’utilisateur, le mot de passe, les clés d’API, etc.
Il ne vous reste plus qu’à importer les données extraites dans la BDD !
#5 – Normaliser et dédupliquer les données
Pour qu’une BDD soit pertinente, il faut à tout prix éviter les doublons et nettoyer un maximum ses données car les informations erronées peuvent vous couter très cher ! Selon Forbes, les données « polluées » coûtent aux entreprises 12% de leur chiffre d’affaires global, soit environ 3.1 billions de dollars par an…
C’est pourquoi, il vous faut étudier régulièrement les données que votre entreprise collecte. Déterminez quelles sont celles que vous utilisez vraiment. Déterminez ensuite celles qui manquent, celles qui ne vous servent pas, et identifiez comment vos données peuvent être polluées.
Avez-vous des champs obsolètes dans de nombreuses entrées ? Avez-vous beaucoup de doublons ? Supprimez-le ! Assurez-vous que les fondements de votre base de données clients ne soient pas erronés afin de ne pas construire votre connaissance clients sur de mauvaises bases !
Si vous souhaitez en savoir plus sur comment nettoyer correctement sa base de données clients, n’hésitez pas à jeter un oeil à notre guide dédié à ce sujet.
#6 – Structurer le modèle de données : la manière dont les données vont s’organiser dans la BDD : les champs, les colonnes, les tables…
La clé d’une BDD saine est l’organisation. Une BDD désorganisée est une BDD illisible, opaque et donc peu user-friendly, surtout lorsqu’elle contient plusieurs dizaines de leads.
Ce faisant, optez pour une base de données segmentée et organisée autour des caractéristiques qui vont permettre de bien connaitre et comprendre les particularités, les besoins et les centres d’intérêts de chaque client. Cette organisation est primordiale puisqu’elle permettra d’identifier plus rapidement les contacts et ainsi mener des opérations de communication ciblées !
Enfin, petite précision qui semble négligeable mais qui fait une grande différence : prenez garde au format de chaque catégorie. Veillez à bien respecter le format afin de garder une lecture aussi limpide que possible.
#7 – Mettre en place des process et règles d’utilisation pour garantir sécurité et santé de la BDD
Une BDD est une mine d’or si elle est toutefois bien gérée. Du fait de la multiplicité des acteurs susceptibles de l’utiliser (utilisateurs métier), de la variété des informations ainsi que de la mise à jour quotidienne nécessaire de ces données, la base de données clients nécessite une politique d’utilisation stricte pour garantie sa sécurité et sa pertinence.
C’est pourquoi, on peut envisager :
- De définir en premier lieu les politiques de sécurité qui régissent son accès et son utilisation. Cela peut inclure l’accès restreint aux utilisateurs autorisés, l’utilisation de mots de passe forts, la limitation des privilèges d’accès en fonction des rôles et des responsabilités, etc. Ces politiques visent à protéger les données clients contre les accès non autorisés et les atteintes à la confidentialité.
- De gérer les droits d’accès : vous devez mettre en place un système de gestion des droits d’accès qui permet de contrôler qui peut accéder à la base de données et quelles actions ils peuvent effectuer. Cela peut impliquer la création de profils utilisateur avec des autorisations spécifiques ainsi que la définition de rôles et de groupes d’utilisateurs.
- De sauvegarder régulièrement les données en créant des copies de sauvegarde et les stocker dans des emplacements sécurisés. Testez régulièrement les procédures de récupération pour vous assurer qu’elles fonctionnent correctement. Envisagez de faire également des mises à jour régulières de votre BDD.
Et voilà, il ne vous reste plus qu’à récolter les fruits de votre travail ! A ce propos, n’hésitez pas à établir des indicateurs de performance pour mesurer l’efficacité de votre BDD. Votre taux de conversion a augmenté ? Vous avez obtenu de nouveaux clients ? Tant mieux ! Votre service client ne s’est pas suffisamment amélioré ? Laissez-vous peut-être encore un peu de temps ou revisitez votre BDD pour la rendre plus pertinente…!
Zoom sur les logiciels de bases de données clients
S’il existe une multitude de logiciels de bases de données clients, toutes ne sont pas nécessairement pertinentes : certaines sont plus adaptées aux entreprises nouvellement créées, tandis que d’autres sont particulièrement appréciées par les grandes entreprises. Par exemple, une entreprise fraichement créée a peu de clients et donc peu de data : on peut donc envisager de construire sa BDD clients sur Excel.
Malheureusement, Excel montre vite des limites. S’ouvrent alors plusieurs options :
- Un logiciel CRM : hyper utilisé depuis les années 1990 par les entreprises pour gérer leurs données clients, les CRM permettaient de centraliser efficacement toutes ces données sur une même plateforme. Le CRM reste un outil traditionnel pour la gestion d’une BDD clients.
- Un logiciel CDP : apparus dans un contexte de digitalisation massive des parcours clients et l’explosion des volumes de données web/comportementales que les logiciels CRM ne savaient pas gérer, les CDP ont connu un fort intérêt depuis le milieu des années 2010. Leur point fort ? Ils permettent la construction d’une BDD Clients 360 en offrant la capacité de centraliser et unifier à la fois les données offline (transactionnelles notamment) et online (données du site web notamment).
- Un Data Warehouse : bien qu’elles existent depuis longtemps, la nouvelle génération de Data Warehouse apparue dans les années 2010 a permis un regain d’intérêt pour cet outil. Très concrètement, les DW offrent une approche moderne dans la gestion d’une BDD Clients, en combinant un Data Warehouse (pour le stockage) et un outil de Data Ops (pour le traitement des données) qui peut, par ailleurs, être une CDP (comme Brevo).
Si vous souhaitez en savoir plus sur l’évolution de ces outils dans la gestion de données clients, n’hésitez pas à jeter un œil à notre guide complet dédié à ce sujet.
Les logiciels CRM
De l’anglais Customer Relationship Management, un logiciel de CRM est une boîte à outils vous permettant de gérer au mieux votre base de données clients. Concrètement, cet outil vous permet de comprendre la relation que chaque client a avec votre marque et par conséquent optimiser la qualité de la relation client, ainsi que des outils marketing précieux pour fidéliser sa clientèle et maximiser son chiffre d’affaires.
Historiquement outil de référence pour la centralisation de données clients, le logiciel CRM représente pour les équipes commerciales, marketing et service client un gain en temps et en efficacité considérable !
Les Customer Data Platforms (CDP)
Dans la même logique que le CRM, la Customer Data Platform (CDP) désigne une solution marketing centralisée qui récolte, unifie et rend accessible les données client (identitaires, comportementales, transactionnelles) issues de différents outils et canaux de contact.
Contrairement au CRM, les solutions CDP vous permettent d’avoir une vue d’ensemble de la manière dont la totalité des clients et plateformes interagissent avec votre marque. Les plateformes CDP suivent le comportement général des clients afin de déterminer comment les audiences et segments interagissent avec votre marque, et vous donnent ainsi une idée du parcours client dans son intégralité.
En traitant, en nettoyant et en contextualisant les données en temps réel, la CDP leur donne un sens. Elle construit des profils clients précis, cohérents et complets dans une base de données accessible aux différentes équipes de l’entreprise, qui profitent d’une data toujours plus pertinente et exploitable pour optimiser leurs futures actions de marketing ou de vente !
Les Data Warehouses
Dans le même état d’esprit qu’une CDP, un Data Warehouse, « entrepôt de données » en français, permet de collecter et conserver les informations de toute une société. On lui trouve quatre caractéristiques propres :
- L’orientation sujet : les données sont classées et définies par domaine et thème, et il est ainsi plus simple de rechercher un sujet désiré dans la base.
- L’intégration de données : on parle ici d’ETL (extract, transform and load) c’est-à-dire d’extraction (sortir les données de la plateforme pour les analyser), de transformation (nettoyer les données) ou encore de chargement (insertion des données). Grosso modo, il s’agit de manier les informations au sein de la base.
- Leur caractère non-volatile : une fois inscrite dans la base de données, l’information est immuable et ne peut pas être modifiée.
- Leur attrait « time-variant » : le Data Warehouse se concentre et analyse les transformations temporelles, pour ainsi déceler et mettre en avant les grandes tendances.
Plus simplement, le système Data Warehouse permet d’étudier et comparer les informations passées et présentes de l’entreprise. Par rapport à une CDP, le Data Warehouse vous permettra d’adopter une vue d’ensemble de l’organisation et se prête ainsi plus à une veille stratégique. Cependant, un DW n’est pas actualisé et mis à jour en temps réel comme une CDP et peut donc être moins efficace concernant l’analyse des données clients. C’est pourquoi il peut être intéressant d’ajouter les services d’une CDP légère comme Brevo !
Pourquoi est-il important de garder le contrôle des données des clients ?
Les 3 dimensions clés du contrôle des données
Commençons par préciser de quoi on parle. Qu’est-ce que ça veut dire concrètement avoir le contrôle de ses données ? Il y a 3 dimensions clés associées au contrôle des données. Avoir le contrôle sur ses données, c’est :
- Avoir un accès complet à ses données.
- Pouvoir gérer la sécurité des données (droits & permissions).
- Gestion de la confidentialité des données.
Revenons en détail sur chacun de ces points, en nous appuyant sur des exemples d’outils : Google Analytics, Snowflake et Amazon S3.
#1 Accessibilité des données (Niveau d’ouverture des données)
Première dimension de contrôle des données : l’accessibilité, le niveau d’accès à vos données. Il varie suivant les outils et systèmes utilisés. Si l’on prend les exemples de Google Analytics, de Snowflake et de AWS 3, il y a un point commun : dans les trois cas, les données sont hébergées dans le cloud, mais le niveau d’accessibilité des données n’est pas du tout identique.
Les données stockées dans Google Analytics ne sont accessibles qu’au travers des tableaux de bord et rapports auxquels Google vous donne accès. Il n’y a pas moyen d’accéder aux données sous-jacentes qui sont utilisées pour construire les dashboards. Vous ne pouvez pas faire de requête SQL sur la base de données Google Analytics. Donc, clairement, le niveau d’accès aux données sur Google Analytics est très faible. Vous n’avez pas le contrôle de vos données !
Dans une infrastructure cloud comme Snowflake, vous pouvez interagir avec vos données via des requêtes SQL complexes, en bénéficiant de toute la puissance de calcul offerte par un DWH Cloud moderne. Par contre, vous ne pouvez pas exécuter de Spark jobs.
Ce serait possible techniquement, mais très coûteux à faire dans la pratique. C’est en revanche faisable avec Amazon S3 qui, de ce fait, est la solution qui offre le meilleur niveau d’accès aux données. Non seulement, vous pouvez connecter S3 à vos outils de BI et exécuter des requêtes SQL, mais vous pouvez extraire les données et les charger dans Spark ou vos autres applications.
La question de l’accès aux données englobe aussi celle de la portabilité des données, c’est-à-dire de la capacité d’extraire les données de l’outil où elles sont stockées pour les héberger ailleurs, dans une autre base, un autre outil. En matière de portabilité, c’est Amazon S3 qui remporte la palme. Vous pouvez facilement basculer vos données d’Amazon S3 vers Google Cloud par exemple. À l’inverse, les données de Google Analytics ne peuvent être extraites vers d’autres systèmes dans leur état brut.
#2 Sécurité des données (gestion et contrôle des accès & permissions)
La deuxième dimension du contrôle des données, c’est la sécurité. Le niveau de sécurité des données se mesure à la capacité que vous avez de gérer les accès à vos données. Si vous gérez tout, alors le niveau de sécurité des données est au top. Si vous choisissez une solution cloud, qu’il s’agisse de Google Analytics et d’une infrastructure cloud comme Amazon S3, vous n’avez pas de contrôle complet sur la sécurité des données. Vous êtes limité par les fonctionnalités de gestion d’accès & de droits proposées par la solution.
Sur Google Analytics, vous pouvez gérer les accès basés sur l’utilisateur, mais vous ne pouvez pas mettre en place un contrôle d’accès basé sur les attributs, contrairement à ce qui est possible avec Amazon S3. Si vous stockez vos données sur vos propres machines, vous pouvez créer des mécaniques de gestion des droits et des permissions 100% sur-mesure. Le niveau de contrôle sur la sécurité des données sera toujours inférieur avec une solution SaaS/Cloud qu’avec une solution auto-hébergée. Plus les données que vous stockez sont sensibles, plus il est important de bien s’informer sur les politiques appliquées par les éditeurs cloud…
Les besoins en matière de gestion de la sécurité ne sont pas les mêmes d’une entreprise à l’autre. Une entreprise qui a une petite base clients et qui collecte peu de données sur ses clients aura typiquement moins de gêne à héberger ses données dans une infrastructure cloud comme Snowflake ou Amazon S3 qu’une grande banque qui stocke de gros volumes de données très sensibles.
#3 Gestion de la confidentialité
La gestion de la confidentialité est la troisième dimension du contrôle des données.
La sécurité des données, dont nous avons parlé plus haut, c’est la question de savoir qui a accès à vos données. La confidentialité des données, c’est la question de l’usage des données et celle de savoir si l’usage que vous voulez faire des données est légal et consenti par l’utilisateur.
Reprenons nos 3 exemples pour illustrer cette dimension : Google Analytics, Snowflake et Amazon S3. Dans ces trois entreprises, il y a des collaborateurs qui ont accès à vos données brutes. Par contre, ce qu’ils peuvent faire ou font avec vos données varie :
- Google Analytics. Il y a forcément des salariés de Google qui ont accès aux rapports que vous avez configurés dans Analytics. Il est très probable que Google utilise « vos » données Google Analytics pour créer un profil utilisateur et à des fins marketing. Même si l’on ne sait pas très bien ce que Google fait de vos données visiteurs/clients, il n’y a aucun doute sur le fait qu’il les utilise.
- Snowflake et AWS3. Il y a des chances que des salariés au sein de ces entreprises aient un accès plus ou moins limité à vos données brutes, mais leurs capacités d’analyse sont plus limitées. Il faudrait qu’ils soient capables de faire du reverse engineering pour utiliser vos données. Ils n’ont pas la capacité de relier les données clients entre elles et de créer un profil utilisateur comme peut le faire Google. Par ailleurs, signalons que, dans S3, vous avez la possibilité de crypter vos données.
En matière de confidentialité, c’est à des solutions d’infrastructure cloud comme Snowflake ou AWS 3 que va le point, clairement.
Absence de contrôle des données = risque
Le couplage données <> applicatifs, un héritage des éditeurs de CRM/CDP
Les données clients sont exploitées par les solutions CRM, les logiciels de Marketing Automation et autres Customer Data Platforms. Elles en constituent le carburant. Ce qui caractérise ces logiciels, c’est le couplage données <> applicatifs. En clair, vos données sont stockées dans les applicatifs, dans vos logiciels. Il n’y a pas de séparation de la couche de données et de la couche logicielle.
C’est le mode de fonctionnement traditionnel des éditeurs de CRM et de CDP. Les données sont collectées, stockées et activées par et dans le logiciel. Le CRM, ou la CDP, est à la fois base de données (avec accès restreint aux données) et outil d’activation. Le développement du modèle SaaS dans l’univers du CRM n’a pas changé grand-chose à cette situation : le couplage reste la règle. Traditionnel ou SaaS, même combat. Même chose pour les Customer Data Platforms dont on parle tant depuis quelques années.
Comment la stack data moderne permet de reprendre le contrôle de vos données ?
Nous avons montré qu’il y avait un problème : le couplage des données et des applicatifs qui les utilisent. La conséquence, c’est le manque de contrôle des données, de vos données clients. La solution, c’est ce dont nous allons parler maintenant : la Stack Data Moderne. Le terme est barbare, jargonneux, on vous l’accorde, mais la réalité qu’il désigne est simple. C’est une nouvelle manière d’organiser les données, une organisation tripartite :
- Un Datawarehouse Cloud qui sert de socle data de l’entreprise. C’est la base de données principale de l’entreprise qui permet d’unifier les données structurées et semi-structurées.
- Les outils métiers qui exploitent les données à des fins d’analyse mais aussi et surtout à des fins d’activation. En clair, les outils de BI de type Tableau ou PowerBI mais aussi et surtout les outils de type CRM, Marketing Automation, Google/Facebook Ads, Diabolocom…
- Un ETL et/ou un Reverse ETL qui permet de faire circuler la donnée entre le Datawarehouse et les autres systèmes de l’entreprise : les logiciels.
Le Datawarehouse moderne comme socle opérationnel
Précisons que nous ne parlons pas ici des Datawarehouses de la nouvelle génération, en plein essor depuis le début des années 2010 : les Datawarehouses cloud. On pense à des noms comme BigQuery (Google), Snowflake, Redshift (Amazon) ou Azure (Microsoft)… Ces infrastructures cloud se sont démocratisées et sont désormais accessibles aux PME, aux startups…
Alors, de quoi parle-t-on ? Un Datawarehouse moderne est une base de données cloud qui sert à stocker toutes les données structurées ou semi-structurées de l’entreprise. Plus qu’un simple entrepôt, un Datawarehouse est une machine de guerre qui permet d’exécuter des requêtes SQL et de réaliser des opérations de jointure sur des volumes énormes de données…le tout beaucoup plus rapidement que les bases de données transactionnelles (OLTP).
Nous sommes convaincus aujourd’hui :
- Que les données doivent être stockées dans une base de données distincte des logiciels.
- Que le Datawarehouse cloud est de loin la solution la plus puissante et la plus économique pour faire office de base de données maîtresse.
Dans cette optique, le Datawarehouse a vocation à devenir la clé de voûte, la solution pivot du système d’information de l’entreprise moderne.
Comment nettoyer sa base de données clients
Qu’est-ce qu’une base client de mauvaise qualité ?
Doublons, données erronées, incomplètes, non normées sont autant d’indices d’une base de données de mauvaise qualité.
Doublons
Il y a un doublon lorsqu’un contact se trouve en double dans une même base de données. L’existence de doublons dans un fichier ou dans une base de données peut avoir 2 origines :
- Les utilisateurs (= l’entreprise). Les erreurs humaines existent, en particulier au moment de la saisie des données. Il arrive qu’un ou plusieurs utilisateurs enregistrent plusieurs fois le même contact dans la base avec une syntaxe ou une orthographe différente.
- Les contacts. Par exemple, un contact peut très bien s’inscrire deux fois à la même newsletter en donnant deux adresses emails différentes. Comme l’email est généralement l’ID utilisé par le logiciel emailing, cela génère un doublon…même si les autres informations données (nom, prénom) sont les mêmes dans les deux cas.
Données erronées
Les données sont erronées quand…elles ne sont pas correctes. Par exemple, l’adresse email n’est pas bonne, le prénom n’est pas bon, etc. Les données erronées sont le fruit d’erreurs au moment de la saisie de l’information, que ce soit par le contact lui-même (dans un formulaire, dans un questionnaire) ou par l’entreprise (commercial, service client…). Une donnée erronée peut aussi (c’est plus rare) résulter d’un problème de compatibilité de format entre la source de collecte et la base dans laquelle atterrit la donnée. On connaît tous les « é » qui se transforment en é dans certains fichiers !
Données incomplètes
Les champs sont rarement tous complétés, tout simplement parce qu’on n’a jamais toutes les informations sur tous les contacts. Le « taux de complétude » est rarement à 100%. La plupart du temps, ce n’est pas gênant, mais des fois, ca peut être très problématique. Les équipes commerciales ne veut pas travailler sur un fichier aussi incomplet, les équipes marketing ne veulent pas personnaliser un message avec une variable dispible à 70%, etc.
Beaucoup de bases de données clients ressemblent à un gruyère composé de plein de trous qui correspondent aux champs vides. Cela a évidemment une incidence sur la qualité de la base de données et son potentiel d’activation (comment voulez-vous envoyer un email aux plus de 50 ans si vous connaissez l’âge de seulement 5% de vos contacts ?).
Données non normées
M. ou Mr. ? 75 ou Paris ? Bien souvent, peu importe le format que l’on choisit, l’essentiel est de choisir un seul format par type de données. C’est l’art de ce que l’on appelle la « normalisation ». Le manque ou l’absence de normalisation des données pose un gros problème de lisibilité et d’activation de la base (des données non normées se traduisent par des variables inexploitables).
Données obsolètes
Les données n’expriment pas une vérité éternelle. Elles vivent comme vivent vos contacts. Une donnée correcte à l’instant t peut donc devenir obsolète à l’instant t+1. On peut prendre l’exemple des adresses postales, des numéros de téléphone, des professions, etc. En fait, la plupart des données (presque toutes) sont sujettes à l’obsolescence.
Nous avons passé en revue les principaux éléments qui portent atteinte à la qualité d’une base de données client. Nous allons voir maintenant les traitements à réaliser pour optimiser la qualité des données, les corriger, les nettoyer dans votre BDD.
Les principaux traitements à appliquer pour nettoyer votre base clients
Voici une liste des principaux traitements pour maintenir et/ou optimiser la qualité des données. Pour chaque traitement, nous proposons une description, des exemples et les solutions possibles.
Découvrez notre guide sur les Customer Data Platforms
Les solutions CDP permettent de préparer, scorer et synchroniser votre base clients. Cela peut faire sens d’étudier le sujet si vous avez des enjeux importants sur votre base clients (et un peu de budget..). Je vous invite à parcourir notre guide sur les CDP pour en apprendre un peu plus sur le sujet.