Que sont les silos de données et quels problèmes causent-ils ?
Publié: 2022-12-29Les données sont votre avantage concurrentiel. Il vous permet d'améliorer vos processus, produits et opérations pour bâtir une entreprise meilleure que la concurrence. Mais les données sont également fragiles, et sans une bonne gouvernance des données, l'intégrité des données peut être compromise.
Dans cet article de blog, nous parlerons de l'une des principales raisons des problèmes d'intégrité des données : les silos de données. Examinons ce qu'ils sont, pourquoi ils existent et comment les décomposer.
Points clés à retenir
- Les silos de données sont des données qu'un individu ou un service conserve et auxquelles les autres membres de l'organisation ne peuvent pas accéder.
- Les organisations en pleine croissance, une mauvaise culture des données et le manque de technologie adéquate sont les principales causes du cloisonnement des données.
- Les silos de données sont problématiques car ils limitent la visibilité de l'entreprise, menacent l'intégrité des données, gaspillent les ressources de l'entreprise, créent un environnement moins collaboratif, conduisent à une mauvaise expérience client et compromettent la sécurité des données.
- Certains symptômes courants des données cloisonnées sont le temps d'accès lent ou les employés frustrés en raison du manque de visibilité de l'entreprise.
- Briser les silos de données est un processus long et difficile. Vous pouvez rendre cela plus fluide en utilisant des plates-formes d'automatisation, comme un pipeline ETL qui extrait des données de différentes sources, les transforme et les pousse vers une seule source de vérité (SSOT).
Que sont les silos de données ?
Considérez les silos de données comme des îlots de données d'entreprise appartenant à un service ou même à un individu, et inaccessibles aux autres membres de l'organisation. Il en résulte des informations isolées qui finissent par corrompre la qualité des données de l'organisation.

Pourquoi les silos de données existent-ils ?
Personne ne commence à planifier la création de silos de données. Mais certaines organisations y sont plus sensibles.
La structure organisationnelle se prête aux données cloisonnées
Les entreprises bénéficient souvent d'une séparation des responsabilités. Mais la départementation peut conduire à isoler certaines données. Chaque service collectant ses propres données à ses propres fins crée par inadvertance des silos de données.
L'entreprise n'a pas une bonne culture de la qualité des données
Les organisations avec une culture de données immature sont plus susceptibles d'avoir des problèmes de silo de données. Ces entreprises manquent généralement de documentation et de gouvernance des données, il n'y a donc pas de compréhension commune de la collecte, de la gestion et du stockage des données.
Cela se traduit par des employés sans conseils appropriés sur le partage des données qu'ils collectent.
La technologie freine les efforts de qualité des données
La technologie peut parfois saboter les efforts d'une organisation pour maintenir des données de bonne qualité.
Lorsqu'une entreprise utilise divers logiciels pour exécuter ses opérations, ces différents logiciels peuvent ne pas être compatibles les uns avec les autres. Cela complique le partage des données.
Alternativement, certaines organisations n'ont pas accès à une technologie qui donne la priorité à la communication entre différentes sources de données, ce qui entraîne inévitablement des problèmes de silo de données.
La croissance des entreprises affaiblit les pratiques de gestion des données
La croissance de l'entreprise entraîne la formation de nouveaux départements, de nouveaux employés, de nouveaux processus et de nouveaux logiciels pour soutenir l'expansion de l'entreprise.
Lorsque la gestion des données n'est pas une priorité, tous ces changements récents laissent les individus inventer au fur et à mesure, ce qui entraîne presque toujours des problèmes de qualité des données, en particulier des silos de données.
Exemples courants de silos de données
Les données ne restent pas isolées en silos. Ce sont les actions que nous entreprenons qui placent les données dans des silos. Voici un examen des cas d'utilisation courants lorsque les organisations limitent l'accessibilité des données (le plus souvent involontairement).
Utilisation de feuilles de calcul dans la plupart des opérations commerciales
Les feuilles de calcul restent l'outil le plus populaire pour traiter, interroger et démocratiser les données dans de nombreuses entreprises. Même s'ils deviennent souvent un casse-tête pour les équipes data.
Des spécialistes non techniques (par exemple, des spécialistes du marketing ou des agents financiers) maîtrisent les formules des feuilles de calcul et font des choses incroyables avec une seule RECHERCHEV.
Malgré leur facilité d'utilisation, les feuilles de calcul deviennent souvent un cimetière pour les données. Après avoir effectué les requêtes requises, les données sont perdues sur le cloud de quelqu'un et n'atteignent pas le stockage centralisé.
Une feuille de calcul devient également un silo de données lorsqu'elle passe du prototype à la production. Si une partie de votre logique métier tourne autour des feuilles de calcul, c'est un signe clair que vous devez trouver quelque chose de plus pratique. Il existe plusieurs raisons d'éviter les feuilles de calcul, allant des plafonds de données à l'incapacité d'inclure chaque feuille de calcul dans un processus de gouvernance des données.
Comment décloisonner vos données des feuilles de calcul : commencez par examiner les feuilles de calcul gigantesques qui sont fondamentales pour certaines de vos opérations commerciales. Ils sont probablement inefficaces en raison de leur taille et des nombreuses macros et formules qui s'y trouvent.
Trouver un moyen de transférer les données vers une architecture plus durable, comme un entrepôt de données cloud, améliorera l'accessibilité des données et les performances individuelles de chaque employé qui interagit avec les données.
Requêtes de transformation mal structurées
Lors de l'agrégation de différents types de données, telles que des données financières, marketing et commerciales, pour créer une source unique de vérité, les choses deviennent un peu compliquées.
Premièrement, différentes données ont des conventions de dénomination différentes qui doivent être alignées pour avoir un sens. De plus, vous devez créer des requêtes supplémentaires en plus des précédentes pour créer des rapports ad hoc sur les performances de la campagne, la croissance des revenus, etc.
Finalement, vous finissez par avoir une requête SQL longue de trois pages qui n'a de sens que pour son propriétaire. Vos tâches de transformation peuvent être si complexes qu'une partie des données requises n'atteint tout simplement pas le pipeline de données.
Le pire, c'est que les analystes peuvent repérer la diminution/augmentation drastique des métriques, mais ils ne peuvent pas en comprendre la raison, car ils ne peuvent pas comprendre comment ces données ont été interrogées.
Comment séparer vos données des requêtes complexes : Le problème peut être abordé de deux manières différentes.
Si votre entreprise effectue des transformations en interne, décomposez les requêtes complexes en plusieurs points de contrôle et stockez-les dans des tables pour un contrôle intermédiaire de la qualité des données. Des étapes de transformation clairement définies et une vérification de la qualité des données après chaque étape garantissent qu'aucune des données ne s'échappe du pipeline.
Une autre option consiste à utiliser des solutions de transformation automatisées pour différents types de données. Par exemple, Improvado, un pipeline de données marketing automatisé, transforme toutes les données selon des recettes prédéfinies. Vous pouvez choisir n'importe quelle recette et savoir exactement à quoi ressembleront vos données après le processus de transformation.
Improvado vous permet également de créer vos propres requêtes de transformation de type SQL dans une interface sans code, semblable à une feuille de calcul. Vous pouvez voir clairement les dépendances entre les différentes entrées de données et transformer les données selon vos besoins, sans écrire de requêtes SQL.
Des solutions tierces qui gardent vos données en otage
Le marché actuel regorge de solutions ETL capables d'extraire vos données de n'importe quelle source, de les transformer en un format digeste et de les afficher dans des tableaux de bord perspicaces. Cependant, la plupart de ces solutions présentent un inconvénient majeur : le verrouillage du fournisseur.
Prenons Datorama (Salesforce Marketing Cloud) comme exemple. Il s'agit d'une solution complète pour les grandes entreprises qui automatise les rapports marketing et rationalise les données provenant de centaines de sources. Dès le premier coup d'œil, c'est le rêve de chaque marketeur. Il propose des rapports ad hoc sur les données de toutes les plateformes publicitaires populaires.
Les choses se compliquent si elles sont vues sous l'angle des silos de données. Vous ne pouvez pas charger les données de Datorama dans votre stockage interne ou fusionner ces données avec des informations tierces recueillies de votre côté. En d'autres termes, vous devenez assez enfermé avec des données disponibles uniquement dans Datorama, et vous ne pouvez pas non plus partager des informations utiles en dehors de la plate-forme.
Ce verrouillage du fournisseur vous rend dépendant du fournisseur et vulnérable à tout changement de politique de prix. Si vous n'êtes pas d'accord avec les changements de prix, vous ne pouvez pas simplement abandonner la plateforme, car vous perdez toutes les données historiques que vous avez accumulées. C'est pourquoi vous devez réfléchir à deux fois avant de confier vos données à de telles plateformes.
Comment éviter que vos données ne soient piégées : si vous décidez d'utiliser une plate-forme tierce, choisissez un fournisseur qui vous donne un accès complet à vos données.
Encore une fois, jetons un coup d'œil à Improvado. Il vous propose différentes manières de stocker vos données. Il peut être chargé soit dans votre entrepôt de données cloud, tel que Google Big Query, soit vous pouvez interroger vos données à partir de l'environnement d'Improvado. Si vous ne disposez pas de votre propre entrepôt de données ou d'expertise pour en gérer un, Improvado propose des services de gestion d'entrepôt de données.
De cette façon, vous savez que vos données resteront avec vous en toutes circonstances et vous pouvez les rendre entièrement accessibles à tout employé de votre entreprise.
Pourquoi les silos de données posent-ils problème ?
Les silos de données sont un problème très courant avec des implications organisationnelles et commerciales de grande envergure.

Limiter la visibilité de l'entreprise
Lorsque les données commerciales pertinentes ne peuvent pas être connectées à une base de données centrale, les informations auxquelles parviennent les décideurs ne reflètent pas l'état réel des opérations commerciales. Cela peut contribuer à des décisions commerciales qui font plus de mal que de bien.
De plus, lorsque les analystes ont besoin de données qui ne sont pas facilement accessibles, il leur faudra beaucoup de temps pour les trouver à différents endroits. Cela réduit le délai d'obtention des informations, le temps moyen nécessaire pour obtenir des informations exploitables et ralentit l'agilité de l'entreprise.
Certaines informations peuvent complètement échapper à l'analyse sans échange de données entre les services.

Par exemple, comment allez-vous attribuer les prospects aux revenus et identifier les canaux les plus performants sans alignement des ventes et du marketing ? Ou, comment connaîtrez-vous la LTV de vos clients sans les informations de l'équipe de réussite client ?
Atteinte à l'intégrité des données
Les silos de données se traduisent par des données commerciales incomplètes, ce qui compromet l'intégrité des données.
Cela peut conduire à de mauvaises décisions commerciales à tout le moins ou à de grandes catastrophes au pire, comme la NASA l'a appris après avoir perdu le Mars Climate Orbiter parce que deux départements n'ont pas communiqué qu'ils utilisaient des unités de mesure différentes.
Même si vous ne travaillez pas dans l'industrie aérospatiale, vous êtes toujours vulnérable aux biais causés par les silos de données. Imaginez un service marketing qui essaie d'optimiser les campagnes pour générer des revenus sans données de vente pertinentes. Toute l'optimisation devient uniquement une conjecture.
Gaspiller les ressources de l'entreprise
Les coûts de stockage des données peuvent être prohibitifs. Étant donné que de nombreux silos de données stockent des données similaires ou obsolètes, votre organisation alloue des ressources budgétaires au stockage de données qui ne sert plus l'organisation.
En fin de compte, les décisions commerciales basées sur ces données peuvent même nuire aux revenus de l'entreprise. Par exemple, si vous avez des données inexactes lors du lancement d'un produit, votre fournisseur de services de messagerie (EMS) peut envoyer le mauvais e-mail aux clients. Ou au mauvais segment, ou au mauvais jour. Cela détruit non seulement la confiance des clients, mais affecte également le retour sur investissement.
Réduire la collaboration des employés
Les données qui ne sont pas librement partagées peuvent créer des conflits entre les employés et les services.
Supposons que vous souhaitiez savoir si le nouveau message résonne et parvient aux prospects. Pour cela, vous devez évaluer la qualité des prospects et vérifier le taux de conversion des prospects en ventes.
Que se passe-t-il si l'obtention de ces données à partir des ventes prend beaucoup de temps, voire pas du tout, ce qui ralentit vos processus ? Cela peut déclencher des sentiments terribles entre vous et votre point de contact au sein du service commercial.
De même, le manque de transparence des données entrave la collaboration entre les différents départements. Ils deviennent leurs propres petites îles où les bonnes idées meurent parce que la collaboration et la coopération ne sont pas encouragées.
Amplifier la mauvaise expérience client
Chaque fois que les clients interagissent avec une entreprise, un logiciel peut enregistrer cette interaction.
Imaginez maintenant s'il n'y avait aucun moyen de connecter les données entre ces différents outils. Une grande partie des données serait cloisonnée et vous auriez beaucoup de mal à déterminer quelle partie du parcours client optimiser et comment personnaliser chaque engagement client.
Cela conduirait en outre à une expérience client décousue qui les éloignerait de votre marque.
Compromettre la sécurité des données
Lorsque les données sont stockées dans le dossier numérique de quelqu'un, qui est inaccessible par un réseau centralisé de sécurité des données, il devient difficile pour les organisations de mettre des mesures de sécurité dans ces archives. Vous n'aurez aucun contrôle sur les autorisations des utilisateurs, ce qui augmente la menace de violation de données.
Comment savez-vous que vous avez des problèmes de silo de données ?
Les problèmes de silo de données se manifestent souvent dans les opérations commerciales quotidiennes. Ils touchent tout le monde à tous les niveaux, des décideurs aux employés de première ligne.
Les cadres supérieurs mettront beaucoup de temps à obtenir les informations dont ils ont besoin pour prendre des décisions. Ils ne sauront pas quels leviers actionner pour atteindre leurs objectifs commerciaux. Ce manque de visibilité sur les tendances du secteur signifie qu'ils sont souvent lents à répondre aux besoins changeants des clients.
Un manque d'alignement des ventes et du marketing peut également être un symptôme de problèmes de silo de données. Lorsque les individus ont l'impression de ne pas avoir accès aux données pertinentes pour effectuer leur travail, il est pratique de pointer du doigt d'autres employés qui « retiennent » l'information. Cela conduit souvent à une concurrence malsaine et à un environnement de travail toxique, sans parler des mauvaises performances et des pertes de revenus.
Comment briser les silos de données
Briser les silos de données peut être l'une des tâches les plus difficiles pour les entreprises. Ils sont tellement ancrés dans la culture de l'entreprise qu'ils sont difficiles à éliminer. Les décomposer doit être une initiative descendante et un programme de formation à l'échelle de l'entreprise.
Acceptez qu'ils existent
Les silos de données peuvent arriver à n'importe quelle organisation. Plus vite votre entreprise acceptera cela, plus vite vous prendrez les mesures nécessaires pour les éliminer.
Comprendre comment les décisions sont prises dans votre organisation
L'objectif principal des données dans toute organisation est de prendre de meilleures décisions. Ainsi, pour comprendre le flux de données au sein de votre entreprise, vous devez d'abord définir clairement le processus de prise de décision.
Chris Ortega, PDG de Fresh FP&A et influenceur financier notable, suggère d'utiliser un cadre appelé Cycle de décision. Selon ce cadre, le cycle de décision décompose les décisions en cinq piliers principaux :
- Processus
- Données
- Renseignements
- Connaissance
- Décisions commerciales
Ces piliers sont liés les uns aux autres. En d'autres termes, les processus conduisent les données. Les données sont ensuite transformées en informations. À leur tour, ces informations deviennent des connaissances qui influencent toutes les décisions commerciales.
Lorsque vous réalisez comment les décisions sont prises au sein de votre organisation, vous pouvez alors identifier les silos de données entre les départements et trouver les bonnes technologies pour automatiser le processus de conversion des données en connaissances et réduire les frictions dans le processus de prise de décision.
Identifiez les silos de données dans votre organisation
Identifiez la cause première de vos problèmes de silo de données. Est-ce la culture d'entreprise ? La technologie? Les processus ? Élaborez ensuite un plan pour les consolider, les remplacer ou les gérer.
Si vous avez des données cloisonnées au sein de l'organisation, vos départements fonctionnent probablement comme des unités commerciales distinctes. Cela signifie que vous devez identifier toutes les données cloisonnées à l'intérieur de chaque service.
Voici quelques signes qui indiquent que vous êtes sur la bonne voie :
- Un département se plaint souvent d'un manque de données pour des activités commerciales particulières.
- Il n'y a pas suffisamment de données pour comprendre l'influence du service sur les processus commerciaux de l'entreprise (imaginez qu'il manque une seule pièce du puzzle dans l'image globale des efforts de votre entreprise).
- Il existe une incertitude quant aux mesures de réussite d'un service particulier.
- Il est impossible d'accéder rapidement aux données du ministère.
Contactez également votre équipe informatique pour obtenir une liste des systèmes utilisés par chaque département afin de mieux comprendre où les données manquent.
Identifier les besoins en données des différents départements et individus
Dressez la liste des différentes équipes qui ont besoin de données et déterminez ce dont elles ont besoin et pourquoi elles en ont besoin. Identifiez ensuite quels autres services enregistrent déjà ces données et comment ils les enregistrent.
Intégrez toutes les données et applications
Trouvez un moyen de faire communiquer différentes applications métier entre elles. Pouvez-vous combiner certaines applications ? Existe-t-il un logiciel qui rend difficile le partage de données ? Pouvez-vous remplacer l'un des outils que vous utilisez actuellement ?
Une fois que vous avez compris cela, créez une source de vérité pour toutes les données collectées par votre organisation. Tirez parti d'outils flexibles et évolutifs, comme une plate-forme ETL qui aide à briser les silos de données, transforme les données en un seul format et charge les données unifiées dans un entrepôt de données.

Ajoutez un contexte métier à vos données
Les données elles-mêmes sont un concept très technique. Il y a des tables, des jointures, des unions et beaucoup plus de jargon technique. Mais lorsqu'il s'agit de processus métier, vos données doivent avoir un contexte métier.
Imaginez une table de base de données nommée « cost-flowchart-1.XML ». Cela ne ressemble pas à quelque chose de grande valeur pour une personne non technique. Mais quand tout le monde sait que ce tableau est une hiérarchie des centres de coûts ou un graphique des leads attirés au cours du trimestre, cela prend un certain sens.
Les données non cloisonnées sont un atout à l'échelle de l'entreprise, pas seulement un ensemble de chiffres pour les ingénieurs de données. Ainsi, il devrait être facile à lire pour quiconque interagit avec lui.
Comme l'a dit Jagdish Sahasrabudhe, SVP Business Applications and Platform chez SAP : « Ce n'est que lorsque vous avez un contexte et une sémantique attribués aux données que c'est ce qui rapproche ces données d'un processus métier. Sans cela, ce n'est qu'un tas de bits et d'octets.
Développer une stratégie pour les données non cloisonnées
Rendre vos données accessibles est génial par défaut. Mais, à plus grande échelle, vous devez vous poser une question : « Pourquoi mon entreprise en a-t-elle besoin ? »
Cela pourrait être un tremplin vers l'innovation, ainsi qu'une initiative qui n'a donné aucun résultat. Et la seule différence entre ces résultats est la stratégie.
Vous pourriez envisager de trouver un partenaire pour combler les lacunes en matière d'expérience et de stratégie lorsqu'il s'agit d'utiliser vos données pour stimuler l'innovation. Au lieu d'assumer cette responsabilité sur vous ou vos collègues, pourquoi ne pas la déléguer à une équipe qui a aidé plusieurs entreprises dans différents secteurs ?
Grâce au cadre des services professionnels, Improvado passe du fournisseur au partenaire et aide les équipes clientes à créer des tableaux de bord perspicaces et à prendre des décisions éclairées en fonction des données disponibles. Il est important d'avoir des conseils et une expertise de votre côté dès le début du processus pour avoir une stratégie claire sur ce qu'il faut faire avec vos nouvelles données.
Développer et mobiliser votre programme de qualité des données
La qualité des données est souvent considérée comme un problème informatique, mais en réalité, il s'agit d'une responsabilité partagée. Encouragez la propriété des données, afin que chacun soit responsable de la création et du stockage de données de bonne qualité. Pour assurer le succès de votre programme de gouvernance des données, rendez-le clair et facile à comprendre pour tous les membres de l'entreprise.
Enfin, faites de la transparence des données un aspect précieux de l'entreprise. Arrêtez la culture de concurrence entre les départements et mettez l'accent sur l'importance de la collaboration pour la croissance de l'entreprise.
Gérez votre nouvelle culture de données
Lancer un nouveau système de qualité des données peut prendre du temps. Certains employés peuvent revenir à d'anciennes pratiques ou ne pas savoir ce qu'ils doivent faire.
Préparez-vous à ces inconvénients. Soyez flexible dans la façon dont vous gérez les données à l'avenir pendant que l'équipe s'habitue à votre nouvelle approche de la gestion des données.
À ton tour
La suppression des silos de données devrait faire partie d'un programme complet de gestion des données. Lorsque vous avez mis en place des réglementations sur la manière exacte dont votre organisation collecte, gère et stocke les données, les silos de données sont moins susceptibles de se produire.
