Votre organisation souffre-t-elle de la fatigue des données ?
Publié: 2021-04-23Dans le monde de la finance, les gestionnaires de placements sont toujours à la recherche de nouvelles sources d'information qui fourniront une source jusqu'alors inexploitée pour créer Alpha. Ces mêmes sources de données sont appelées données alternatives ou fatigue des données. Des données parce que, eh bien, des informations. Alternative car ils sont au-delà des ensembles de données typiques de l'entreprise. Au risque de surjouer le cliché, c'est ce qui déclenche « l'avantage injuste » que nous recherchons tous.
Le marché des données alternatives est encore très brut et naissant. L'entreprise qui le dépense augmente d'année en année. Certaines des sources les plus populaires de données alternatives étaient les transactions par carte de crédit, les données récupérées en ligne , les données de géolocalisation des mobiles, etc. Intuitivement, vous pouvez dire que ces sources passeraient sous le radar pour avoir violé de graves problèmes de confidentialité. Ergo, le besoin de points de données alternatifs moins intrusifs.
Alors que le marché des données alternatives est actuellement florissant malgré les problèmes de sécurité - et qu'il devrait valoir 350 millions de dollars en 2020, soit près du double par rapport aux 183 millions de dollars de 2016 -, nous avons vu des entreprises souffrir de la fatigue des données alternatives en 2019. Fatigue des données alternatives, demandez-vous ? Oui, c'est tout aussi explicite. Le vieil adage « Du vieux vin dans une nouvelle bouteille » me vient à l'esprit. Le même groupe d'ensembles de données est reconditionné et vendu aux mêmes groupes de gestionnaires de fonds spéculatifs, qui perdent un temps précieux à préparer les données plutôt qu'à les analyser. À ce moment-là, le marché est saturé de nouvelles entreprises : qui offriront toutes la même promesse d'informations concurrentielles.
Informations personnalisées sécurisées
Il existe certaines mesures d'ordre d'hygiène de base que vous pouvez suivre pour éviter la fatigue des données alternatives. La première étape consiste à vous assurer que vous sécurisez des informations personnalisées et spécifiques à votre entreprise qui feront progresser votre entreprise. C'est le grand différenciateur si vous voulez éviter la fatigue. Grâce aux répercussions de l'intérêt toujours croissant pour les données alternatives, il existe une multitude de sociétés de recherche qui offrent les meilleures informations sur les données alternatives et/ou vendent des ensembles de données alternatifs aux investisseurs, aux gestionnaires de fonds, aux agents de voyage et à toute autre personne cherchant à en profiter. poney. Imaginez les mêmes ensembles de données, les mêmes informations tirées du même ensemble de données, les mêmes points exploitables sur la base des informations tirées du même ensemble de données par l'entreprise A et l'entreprise B. Avec une seule petite différence. Ils ignorent tous les deux qu'ils utilisent les mêmes informations l'un contre l'autre.
Les flux de données alternatifs peuvent être tout ce qui n'est pas considéré comme "traditionnel" par une entreprise particulière. Les lignes deviennent vraiment floues. Ce qui était alors considéré comme non conventionnel est aujourd'hui l'un des principaux moteurs de décision marketing. Il faut veiller à ce que ce qui est considéré comme « alternatif » pour vous ne devienne pas la norme de l'industrie au cours de l'année à venir. Cela signifie que tout le monde aura un accès égal aux données que vous avez dépensé beaucoup d'énergie à rassembler.
Léthargie des données alternatives
Il s'agit de récupérer et de maintenir les données « courantes » telles quelles. Prendre le temps et l'énergie nécessaires pour gratter, maintenir et gérer de grandes quantités de données alternatives est absolument tangentiel au cercle principal de préoccupation. Quel est donc le grand coupable ici ? Oui, vous l'avez deviné. Léthargie.

Les ensembles de données alternatifs comprennent généralement des informations extraites d'une pléthore de sources et de sites Web. Le processus de grattage des données peut vous empêcher d'analyser les découvertes et de tirer des idées. Sans parler de la portée accrue de l'erreur humaine et de la duplicité. Le grattage est la première grande étape. Il s'agit ensuite de le normaliser. Il doit être dans un format « standard » pour avoir un sens. C'est la seule façon pour la machine d'apprendre et d'automatiser le processus.
Maintenant que nous avons le format en place, la prochaine étape consiste à dessiner la véritable intention des données collectées. Vous savez à quel point l'anglais américain et l'anglais britannique diffèrent énormément ? Nous ne sommes pas les seuls à trouver cela ennuyeux. Par exemple, il existe deux manières distinctes d'écrire une seule date. Le 27 mai 2021 peut s'écrire 27/05/2021 ou 27/05/2021, et nous n'avons pas à vous dire le type de répercussion que cette différence aurait sur les données collectées. Par conséquent, vous devez gratter, standardiser, tirer des enseignements et prendre des décisions commerciales stratégiques. Avec le minimum d'effort humain.
Se débarrasser de la fatigue des données
Nous n'évoquons jamais les problèmes auxquels nous n'avons pas de solutions. Il y a un tas de choses par lesquelles vous pourriez commencer :
- Automatisation : Celui-ci est une évidence. Nous venons d'expliquer les effets d'erreurs humaines apparemment inoffensives. Le plus souvent, les données extraites sont laissées sous forme de fichiers autonomes qui sont ensuite intégrés manuellement. Tout comme la normalisation automatisée des données, l'automatisation du processus d'intégration réduit considérablement la fatigue qui s'installe avec le travail axé sur la main-d'œuvre et permet à l'équipe de canaliser tous ses efforts sur l'analyse des données. L'intégration des données peut être rendue humaine en préparant les données avec des API pour prendre en charge une intégration transparente avec les systèmes d'entreprise internes et créer des ensembles de données robustes à des fins d'analyse.
- Externaliser : Il est toujours logique d'automatiser les tâches banales. Surtout lorsque vous avez besoin d'un niveau d'expertise technique. Assurez-vous simplement d'inclure une clause d'exclusivité de non-concurrence. Sinon, vous retrouveriez les mêmes données entre les mains de vos rivaux. Et serait-ce une déception.
- Sur mesure : si vous décidez d'externaliser toute l'aide alternative aux données, associez-vous à une entreprise qui a les capacités de créer des ensembles de données personnalisés pour votre marque. Une approche unique ne fonctionnera pas ici. Ils doivent disposer des bonnes capacités d'intégration de données Web. L'intégration des données traite l'ensemble du cycle de vie des données extraites du Web comme un processus unique et cohérent, en mettant l'accent sur la qualité et le contrôle des données.
Il existe un million d'autres façons d'éviter absolument la fatigue des données en extrayant des données personnalisées . C'est beau. Analyse du sentiment de votre section de commentaires sur les canaux de médias sociaux, données de carte de crédit pour déchiffrer le comportement de consommation des consommateurs (cependant mal vu). Utilisation d'images satellitaires et/ou de surveillance pour compter les voitures dans les stationnements. Vous n'avez qu'à dire à votre fournisseur de service de scraper Web de collecter la nature exacte des données dont vous avez besoin. C'est tout. Tuez la fatigue. Vous êtes destiné à de meilleures choses.
