Gestion des données : mise à l'échelle efficace de l'utilisation des données
Publié: 2022-12-23Les bases de données d'entreprises regorgent de données. Cela peut rendre très difficile la recherche d'informations commerciales significatives pour alimenter la stratégie et les opérations. Une bonne gestion des données résout ce problème.
Points clés à retenir
- La gestion des données consiste à superviser efficacement les données tout au long de leur cycle de vie, de la création à la destruction des données.
- D'un point de vue marketing, la gestion des données favorise une culture axée sur les données et garantit que les données que vous collectez et stockez sont fiables et dignes de confiance.
- Les techniques et solutions permettant de créer des stratégies de gestion des données solides incluent la préparation des données, les pipelines ETL, la gouvernance des données, etc.
- La gestion des données n'est pas simple et s'accompagne de défis. Suivez les meilleures pratiques pour créer une stratégie efficace que tous les membres de l'entreprise peuvent suivre.
Qu'est-ce que la gestion des données ?
La gestion des données consiste à superviser efficacement les données tout au long de leur cycle de vie, de manière rentable et sécurisée. L'objectif principal est d'organiser, de stocker et de gérer les données de manière à en faciliter l'accès, la récupération et l'utilisation. Cela inclut des tâches telles que :
- Recueillir des données auprès de diverses sources ;
- Stocker les données de manière sécurisée et organisée ;
- S'assurer que les données sont exactes et à jour ;
- Protéger les données contre l'accès non autorisé ou la falsification ; et
- Analyser et interpréter les données pour extraire des informations et permettre la prise de décision.
En termes de marketing, des processus de gestion des données clients bien établis favorisent une culture axée sur les données au sein du service. Il garantit que vous stockez des données de haute qualité pour obtenir une vue précise et complète de vos efforts de marketing et de vos clients à divers points de contact. Ceci, à son tour, vous aide à mieux comprendre votre public cible, à communiquer des valeurs qui correspondent aux douleurs de votre public et à identifier les stratégies les plus performantes qui sont les plus susceptibles d'augmenter le retour sur investissement marketing (ROMI).
Pourquoi la gestion des données est-elle importante ?
Une gestion efficace des données crée de l'ordre dans la grande quantité de données que les entreprises collectent.
Il donne aux organisations une feuille de route sur la manière de collecter et de manipuler correctement les données pour éviter qu'elles ne deviennent désordonnées ou inutilisables, leur permettant de prendre des décisions rapidement et de répondre rapidement aux besoins du marché.
Cela libère également les ressources des employés. Par exemple, un sondage réalisé par Vicky Boykis, ingénieur senior en machine learning chez Duo et influenceur notable du créneau, montre que la majorité des data scientists passent 60% de leur temps à nettoyer et déplacer des données :
Les solutions de gestion des données peuvent entièrement automatiser les tâches manuelles et laisser les analystes faire leur travail au lieu de réparer les données brutes.
Solutions et techniques de gestion des données
La bonne nouvelle est que des pétaoctets de données brutes et médiocres peuvent être gérés. Avec des politiques claires et les bons outils, votre entreprise prospérera avec une culture axée sur les données et avec des employés qui assument l'entière responsabilité des données qu'ils collectent.
Préparation des données
Ce n'est un secret pour personne que de nombreuses entreprises sont aux prises avec des données de mauvaise qualité. Leurs données peuvent être incohérentes et redondantes ou stockées dans différents formats sans taxonomie cohérente.
La préparation des données est le processus d'agrégation, de transformation et de structuration des données brutes pour les préparer à une analyse plus approfondie. Les outils de préparation des données rassemblent les données dans un format unifié, éliminent les incohérences, signalent les erreurs et combinent les données automatiquement. Dans l'ensemble, ce processus garantit que les informations que votre équipe obtient au cours de l'analyse et que les rapports que vous consultez sont valides car les données sur lesquelles ils sont basés sont de haute qualité.
Pipeline de données
Un pipeline de données est une série automatisée d'activités qui commence par l'ingestion de données et se termine par un récepteur de données, tel qu'un entrepôt de données, un service de stockage ou une autre application. Il rationalise le traitement des données en éliminant la saisie et la manipulation manuelles des données, accélérant considérablement les processus d'analyse marketing et de création de rapports.
Pipeline ETL
Extraire, transformer et charger (ETL) est un sous-ensemble d'un pipeline de données.
Le processus ETL automatise l'extraction de données à partir d'une ou plusieurs sources, les transforme en un format standardisé et utilisable, et les charge sur un terminal, comme un entrepôt de données ou un logiciel de BI.
Ce point de terminaison devient la source unique de vérité (SSOT) de l'organisation. Les données stockées ici sont déjà propres, formatées et prêtes pour l'analyse, la visualisation ou la création de rapports.
Par exemple, des outils d'analyse marketing avancés comme Improvado tirent parti de l'ETL pour extraire des données de plus de 300 sources de données marketing et commerciales, telles que Shopify, Facebook Ads, Google Analytics, etc., transforment les données en un format prêt pour l'analyse et les chargent vers la destination désignée. , c'est-à-dire un entrepôt de données marketing ou un outil de BI, de visualisation ou d'analyse.
Entrepôt de données
Un entrepôt de données est la zone de stockage des données historiques et en temps réel de votre entreprise. Il stocke généralement des données structurées provenant de plusieurs sources telles que diverses plates-formes publicitaires, les médias sociaux, etc.
Au tout début de l'utilisation de l'analyse, les entreprises utilisent souvent des feuilles de calcul pour stocker leurs données. Cependant, ils finissent par atteindre la fin de leur feuille de calcul. À ce stade, les ensembles de données sont devenus trop volumineux et les requêtes s'arrêtent. Les entreprises techniquement avancées migrent vers des entrepôts de données cloud, tels que Google Big Query, pour permettre aux équipes d'analyse d'interroger les données plus souvent et d'augmenter leur productivité globale.
Sécurité des données
La sécurité des données consiste à mettre en place des précautions pour protéger les données de l'entreprise contre la corruption ou l'accès non autorisé tout au long de son cycle de vie. Il garantit également que l'entreprise se conforme aux lois et réglementations sur la confidentialité des données, telles que HIPAA, SOC-2 et GDPR.
Gouvernance des données
La gouvernance des données est le fondement de données de bonne qualité. Il s'agit d'un processus qui détaille les politiques et procédures régissant la collecte, l'organisation, le stockage et l'analyse des données. Son objectif est de garantir des données exactes, complètes, cohérentes, opportunes, valides et uniques.
Cadres de gestion des données
Les équipes travaillent ensemble avec ces solutions et techniques pour atteindre la qualité des données et configurer correctement tous les processus de gestion des données. Vous ne pouvez pas obtenir la meilleure qualité de données sans mettre en œuvre simultanément la gouvernance des données, la sécurité des données, l'architecture des systèmes d'information, etc.
Un cadre de gestion des données est un ensemble de règles et de techniques requises pour mettre en œuvre la gestion des données dans votre entreprise. Actuellement, il existe deux cadres généralement reconnus.
DAMA-DMBOK 2
DAMA-DMBOK 2 signifie Data Management Association - Data Management Body of Knowledge version 2. Il s'agit de la deuxième édition du cadre initialement publié en 2009.
Le cadre identifie 11 domaines de connaissances interdépendants qui constituent la gestion des données. En suivant ce cadre, une entreprise doit prendre tous les domaines en considération.
DMBOK 2 implique également que ce ne sont pas seulement les professionnels de la gestion des données qui s'occupent des processus de gestion des données ; tous les professionnels de l'entreprise y sont associés. L'hexagone DAMA montre une relation directe entre les personnes, les processus et les technologies.
DMBOK 2 définit la mission principale de la gestion des données de la manière suivante : « Répondre aux besoins de disponibilité, de qualité et de sécurité des données de toutes les parties prenantes ». Il décrit également les outils, les participants, les métriques et les livrables impliqués dans le processus de gestion des données.
Cependant, ce cadre présente un inconvénient majeur. Il ne décrit pas la relation entre les différents domaines de connaissances, laissant tout à vous de décider. Au total, DMBOK 2 fournit beaucoup de connaissances théoriques mais peu de conseils pratiques.
DCAM
Alors que DMBOK 2 est un cadre accessible au public, DCAM (le modèle d'évaluation des capacités de gestion des données) est fermé à l'accès public. Seuls les membres de l'Enterprise Data Management Council (EDC) peuvent accéder à ce cadre.
Le cadre décrit la gestion des données en termes de différentes capacités avec différents niveaux de maturité. Même si DCAM a une orientation pratique et opérationnelle, il ne fournit pas un point de vue clair sur la mise en œuvre de la gestion des données.
Les entreprises utilisent DCAM pour évaluer leurs processus, éduquer les parties prenantes et identifier les faiblesses de leurs programmes de gestion des données. Il vous aide également à atténuer les risques de violation de la réglementation sur la confidentialité des données, y compris le RGPD.

Étant donné que le cadre n'est pas accessible au public, il n'y a pas beaucoup d'informations sur ses meilleures pratiques et recommandations. Cependant, l'Enterprise Data Management Council a récemment publié une version publique de son Cloud Data Management Capabilities Framework, qui met en lumière l'approche utilisée par EDC pour définir ses cadres.
Ces deux cadres peuvent constituer un bon point de départ dans votre parcours de gestion des données. Ils décrivent des concepts cruciaux, de sorte que vous maintenez une clarté totale lors de la première mise en œuvre de la gestion des données.
Défis de gestion des données
Vous rencontrerez de nombreux défis dans vos efforts pour gérer les données de votre organisation. Mais lorsque vous serez conscient de ces défis potentiels, vous serez mieux préparé à les relever.
Sécuriser les données de l'entreprise
Il existe de nombreuses menaces internes et externes à la sécurité et à l'intégrité des données. Et les violations de données peuvent survenir à tout moment. Cela met en danger les données privées et personnelles de vos clients.
Voici comment DMBOK-2 définit le processus de sécurité des données :
Il est toujours préférable de traiter les risques de sécurité par des efforts coordonnés, plutôt que par des tentatives individuelles. Le processus implique trop de tâches pour qu'un seul employé puisse s'en occuper. À plus grande échelle, la sécurité des données s'articule autour de quatre activités principales :
- Identifier et classer les actifs de données sensibles ;
- Localiser les données sensibles au sein de l'entreprise ;
- Déterminer comment chaque actif doit être protégé ; et
- Comprenez comment ces informations interagissent avec les processus métier.
Ensuite, vous devez également évaluer les menaces externes, telles que l'ignorance ou l'inattention de vos employés. La gestion de l'accès aux données et la conformité aux politiques réduisent le risque d'exposition des données sensibles et augmentent le niveau de sécurité de l'infrastructure de votre entreprise.
Traiter trop de données
Jusqu'à 73 % des données sont inutilisées, car de nombreuses entreprises ont du mal à suivre le rythme de l'énorme quantité de données provenant de différentes sources. Les organisations qui n'ont pas de directives de gestion des données pour l'analyse omnicanal sont dépassées, alors elles inventent ou n'utilisent pas les données disponibles.
Cependant, n'essayez pas de gérer toutes les données à la fois. Les entreprises produisent de grands ensembles de données, dont une grande partie n'est jamais utilisée. C'est pourquoi le cycle de vie de la gestion des données recommande de se concentrer sur les données les plus critiques et de minimiser la ROT des données (données redondantes, obsolètes ou triviales).
Combiner des données provenant de différentes sources
Pensez aux dizaines d'outils que votre entreprise utilise. Même au sein du service marketing, vous utilisez probablement plusieurs outils de collecte et d'analyse de données.
Cela peut créer des silos de données, ce qui se produit parce que les données sont stockées dans des solutions de stockage isolées qui ne communiquent pas entre elles. En conséquence, chaque département s'assoit sur ses données, ce qui rend la collaboration interdépartementale plus difficile.
Données de mauvaise qualité
Les organisations consacrent près d'un quart de leur chiffre d'affaires à la résolution de problèmes de qualité des données.
Des données de mauvaise qualité résultent d'erreurs lors de la saisie des données, de la corruption des données lors du transport des données d'un outil à un autre ou d'un manque de pratiques normalisées.
Voici un aperçu complet de la gestion de la qualité des données par DMBOK-2 :
Le cycle de vie de la gestion des données, la gouvernance des données et l'accent mis sur les données critiques sont quelques-uns des facteurs les plus importants à prendre en compte lorsque vous essayez d'améliorer la qualité de vos données.
Gardez à l'esprit que la « qualité des données » est un terme collectif qui comprend 12 caractéristiques qu'un ensemble de données digne de confiance devrait avoir.
Pénurie d'analystes de données qualifiés
Malgré tous les discours sur l'importance des données pour les entreprises numériques et modernes, les analystes de données experts sont difficiles à trouver. L'embauche d'un analyste qualifié prend du temps, et la formation des nouvelles recrues peut s'avérer coûteuse et chronophage.
Manque de gouvernance des données
De nombreuses entreprises créent des normes de gouvernance des données après coup lorsque leurs données sont déjà devenues désordonnées. Sans gouvernance des données, les organisations sont submergées de données de mauvaise qualité. En conséquence, les analystes passent trop de temps à nettoyer les mauvaises herbes et les utilisateurs finaux passent trop de temps à essayer de lui donner un sens.
Meilleures pratiques de gestion des données
La gestion des données est une tâche importante impliquant de nombreuses pièces mobiles. Mais il existe des bonnes pratiques de gestion des données qui peuvent vous permettre de démarrer du bon pied.
Donner la priorité à la protection et à la sécurité des données
Les violations de la sécurité des données sont des problèmes d'un million de dollars qui peuvent être évités grâce à de bons principes de gestion des données.
Certaines mesures de protection des données incluent le fait d'avoir des autorisations d'utilisateur appropriées, d'avoir un système centralisé qui gère et gère les données et d'utiliser uniquement des logiciels qui respectent les lois sur la confidentialité des données.
Intégrez toutes vos données et créez une seule source de vérité
Les organisations ont beaucoup de données qui peuvent être stockées dans des silos de données. Cela signifie qu'il est difficile d'avoir une vue complète du paysage des affaires. Pour les professionnels du marketing, cela les empêche de voir différents points de contact avec les clients.
Lorsque vous intégrez toutes les données dans une zone de stockage centralisée à l'aide d'un pipeline ETL, par exemple, il devient plus facile d'obtenir des informations sur les données de revenus.
Utiliser un logiciel de gestion des données de qualité
La manipulation manuelle des données ne suffit plus avec les volumes de données que les entreprises traitent.
Heureusement, il existe de nombreuses nouvelles technologies et solutions logicielles d'automatisation qui facilitent et accélèrent la collecte et l'analyse des données. Utilisez un logiciel de bonne qualité qui s'intègre bien avec d'autres applications.
Créez un glossaire des métadonnées de votre organisation
Ayez une définition standardisée de toutes les données que vous collectez (également appelées « métadonnées »). Incluez des détails spécifiques tels que les attributs de données, la date de création, le nom du créateur et la zone de stockage.
Cela garantit la transparence et l'alignement dans l'ensemble de l'organisation.
Rendre chacun responsable de la qualité des données
La qualité des données est une responsabilité partagée. Ce n'est qu'en responsabilisant chacun dans l'organisation que les problèmes de données courants peuvent être réduits.
Quel est le rôle du marketeur là-dedans ? Les spécialistes du marketing sont en partie responsables de la collecte des données primaires : ils connaissent la taxonomie des balises UTM, le balisage des campagnes publicitaires et les comptes qu'ils doivent suivre. Pendant ce temps, les ingénieurs et analystes de données sont responsables de la qualité des données à d'autres étapes du flux de données.
Premières étapes pour établir des pratiques de gestion des données
La route pour devenir une organisation axée sur les données commence par des pratiques de gestion des données appropriées. Soutenez cette transformation en suivant les pratiques auxquelles adhèrent les entreprises prospères axées sur les données.
1. Investissez la suite C dans la création d'un plan de gestion des données
La gestion des données est difficile lorsque la suite C n'est pas investie dans l'ensemble de l'entreprise. Ils doivent voir la valeur d'une stratégie de gestion des données correctement exécutée afin de devenir proactifs dans sa mise en œuvre.
2. Auditer les données actuelles
Très probablement, votre entreprise recueille déjà beaucoup de données. Auditez ce que vous avez déjà. Observez la configuration du terrain et élaborez un plan de gestion des données basé sur les données dont vous disposez déjà, en tenant compte des objectifs et des ressources de votre organisation.
3. Utilisez autant que possible les outils d'automatisation
L'erreur humaine est une cause fréquente de mauvaise qualité des données. La gestion des données devient plus rapide et plus facile si vous choisissez les bons outils d'automatisation. Vous réduirez également considérablement les erreurs humaines lors de la collecte, de la manipulation et de l'analyse des données.
4. Planifier la croissance
Les données que votre entreprise recueille ne feront que croître. Rendez votre stratégie de gestion des données flexible afin qu'elle évolue avec votre entreprise et qu'elle évolue sans effort.
5. Trouver un partenaire technologique fiable
Construire une pile technologique et trouver les bons partenaires sont essentiels pour établir des processus de gestion des données fiables, en particulier lorsque la sécurité des données des clients est en jeu. Improvado est une solution d'analyse marketing avancée qui s'intègre dans l'environnement d'analyse existant et favorise la culture des données dans l'organisation. La solution est une gestion et un reporting automatisés des données marketing, ce qui garantit que votre équipe ne s'appuie que sur des données de haute qualité et à jour pour stimuler les performances de l'entreprise.
À ton tour
Suivre les meilleures pratiques de gestion des données décrites dans ce guide vous aidera à nettoyer vos données et à faire évoluer votre organisation vers un état d'esprit davantage axé sur les données. Ce ne sera pas un processus facile. C'est un voyage. Mais cela vaut la peine de le faire pour obtenir des données de haute qualité auxquelles tous les membres de votre entreprise peuvent faire confiance et sur lesquelles s'appuyer pour obtenir des informations commerciales exploitables.







