La qualité des données contre la gouvernance des données : laquelle doit venir en premier ?

La qualité des données contre la gouvernance des données : laquelle doit venir en premier ?

12 avr. 2024

Nicola Askham

Nicola Askham

Nicola Askham

Le Coach de Gouvernance des Données

Le Coach de Gouvernance des Données

Le Coach de Gouvernance des Données

Natasha Lauer

Natasha Lauer

Natasha Lauer

Ancien Responsable Marketing chez Soda

Ancien Responsable Marketing chez Soda

Ancien Responsable Marketing chez Soda

Table des matières

Comme la question proverbiale de savoir ce qui est apparu en premier, la poule ou l'œuf, de nombreuses personnes dans la communauté de gestion des données se demandent, lequel devrait venir en premier, la qualité des données ou la gouvernance des données ?

Ce n'est pas une question facile à répondre. La plupart d'entre nous comprennent ce qu'est la qualité des données - « des données suffisamment bonnes pour être utilisées » est un concept assez simple à saisir. La gouvernance des données, en revanche, semble être quelque chose qui vous empêche de faire votre travail et, soyons honnêtes, cela semble aussi plutôt ennuyeux ! Mais ce n'est pas vrai ; la gouvernance des données consiste à comprendre les données que votre organisation possède et à avoir un cadre structuré de rôles et de responsabilités pour les gérer. Cela garantit que les bonnes personnes peuvent prendre des décisions cohérentes concernant la qualité et l'utilisation de vos données.

La qualité des données garantit des données précises, complètes et fiables, tandis que la gouvernance des données fournit les politiques, les rôles et les cadres pour les gérer.

La gestion de la qualité des données et la gouvernance des données sont toutes deux des activités critiques de gestion des données. Après tout, il n'y a pas beaucoup d'intérêt à gérer vos données si vous n'êtes pas sûr qu'il s'agisse des bonnes données ou si elles sont d'une qualité suffisante pour être utilisées.

Bien faites, la gestion de la qualité des données et la gouvernance assurent que les bonnes données de la bonne qualité sont disponibles pour les personnes et les systèmes qui en ont besoin.

Ajoutez d'autres activités de gestion des données au mélange et nous pouvons nous assurer que les données sont sécurisées, stockées de manière logique sur les systèmes, et disponibles pour l'analyse et l'apport d'insights.

Qu'est-ce qui vient en premier : la qualité des données ou la gouvernance des données ?

Revenons à notre question d'origine et pourquoi il n'est pas simple d'y répondre. Bien qu'en théorie ce soient deux disciplines distinctes de gestion des données, elles sont profondément interconnectées et vous ne devriez pas en faire une sans l'autre. Je les décris souvent comme symbiotiques — elles se soutiennent mutuellement et idéalement, les deux activités seront menées par la même équipe. Avec cela à l'esprit, vous pouvez voir qu'il est difficile de décider par où commencer.

Dans un monde idéal, nous concevrions et mettrions en œuvre notre cadre de gouvernance des données avant de se concentrer sur la qualité des données.

Malheureusement, nous ne vivons pas dans un monde idéal, et je n'ai jamais rencontré d'organisation qui ait mis en place la gouvernance des données avant de commencer des activités de qualité des données.

Il y a une raison à cela. Il y a toujours des gens dans certaines parties de votre organisation qui comprennent quand les données ne sont pas suffisamment bonnes pour qu'ils fassent leur travail et ils prennent des mesures pour y remédier. Cela conduit à des activités de nettoyage de données ponctuelles, et peut-être à quelques rapports de qualité des données de base mais avec des degrés de succès variés. Hélas, sans une gouvernance des données en place, ces activités ont tendance à être tactiques au mieux et souvent de courte durée dans le cas du reporting de qualité des données.

Pouvez-vous commencer par la qualité des données avant la gouvernance ?

Je ne voudrais jamais critiquer quelqu'un qui a pris l'initiative d'améliorer la qualité des données, mais le faire sans la fondation d'un solide cadre de gouvernance des données conduit à une duplication d'efforts et peut même empirer les choses.

Au fil des ans, j'ai rencontré d'innombrables cas où plusieurs équipes nettoyaient manuellement ou corrigeaient le même ensemble de données, mais pas exactement de la même manière. Cela a abouti à une variété de réponses différentes à des questions de base comme « Combien de clients avons-nous ? » ou « Combien de ventes avons-nous réalisées le mois dernier ? » De grandes quantités de temps sont alors gaspillées alors que différentes équipes participent à des débats animés pour savoir pourquoi leur réponse est la bonne réponse !

Bien que la gouvernance des données soutienne toutes les autres disciplines de gestion des données, l'une des principales raisons pour lesquelles elle est mise en place est de soutenir une meilleure qualité des données.

Avoir une gouvernance des données en place permet une approche proactive à la résolution des problèmes de qualité des données, en corrigeant la source du problème une fois pour toutes.

Cela arrête le cycle sans fin de nettoyage des données continu et de débats sans fin sur les données qui sont vraiment correctes.

Mais pourquoi commencer par la gouvernance des données ?

Eh bien, une partie clé de la gouvernance des données est un catalogue de données.

Un catalogue de données nous aide à comprendre et à définir les données que nous avons. C'est un inventaire centralisé et consultable des actifs de données d'une organisation qui utilise des métadonnées pour aider les utilisateurs à découvrir, comprendre et gouverner les données efficacement.

Après tout, comment pouvons-nous définir les règles de qualité des données si personne ne peut s'entendre sur ce que sont ces données en premier lieu ?

Tout le monde pense savoir ce que sont les données, mais ce n'est qu'en commençant à documenter les définitions des données que vous réalisez que les gens ont des points de vue différents. Ces points de vue différents peuvent causer une foule de problèmes et d'inefficiences et doivent être exposés et résolus.

Avoir une gouvernance des données en place en premier lieu garantit que les bonnes personnes prennent les décisions concernant les règles de qualité des données.

C'est particulièrement important pour les données utilisées par plusieurs personnes à travers une organisation. Sans un propriétaire des données, de nombreuses équipes prennent des décisions contradictoires sur ce qui est acceptable pour la qualité d'un produit de données.

Il est important de concevoir une structure de propriétaires de données et de gestionnaires de données qui peuvent travailler à travers les silos organisationnels et encourager la communication, de sorte que toutes les décisions concernant la qualité des données tiennent compte des besoins de tout le monde.

Quels sont les défis de la mise en œuvre de la gouvernance en premier ?

Il est facile de dire que nous devrions faire la gouvernance des données en premier, mais ce n'est pas toujours aussi simple. Si vous travaillez dans une organisation distribuée, il peut ne pas être facile de s'accorder sur un seul propriétaire de données pour des données largement utilisées. Cela peut sembler plus facile de laisser tout le monde faire à sa guise, mais cela ne mène pas à des résultats positifs à long terme.

Malheureusement, peu d'organisations ont le luxe de pouvoir mettre en œuvre une gouvernance des données avant de commencer les activités de qualité des données. La seule exception est les start-ups.

J'ai discuté avec des personnes dans plusieurs start-ups au fil des ans et bien qu'elles démarrent d'une feuille blanche, elles sont généralement contraintes par la nécessité d'être aussi économes que possible. Cela signifie qu'elles ne sont pas toujours ouvertes à la définition des données avant de commencer à les utiliser.

Comment pouvez-vous surmonter ces obstacles ?

Vous devez associer la mise en œuvre des activités de gouvernance des données et de qualité des données aux objectifs globaux de l'entreprise. Expliquez que si vous mettez en œuvre de solides pratiques de gestion des données maintenant, vous pouvez éviter les problèmes futurs et, plus important encore, augmenter les chances de succès de l'organisation.

Rappelez-vous, la gouvernance des données peut sembler être une activité de conformité, mais en réalité, lorsqu'elle est bien faite, elle apporte une valeur commerciale réelle.

Quand devrais-je mettre en œuvre la gouvernance des données ?

Si vous travaillez dans une start-up : faites-le tôt ; si vous ne l'êtes pas, mettez-le en œuvre dès que possible.

Les avantages de la mise en œuvre incluent :

  • faciliter l'automatisation

  • réduire les inefficacités et les coûts

  • simplifier les expériences client

  • améliorer la gestion des risques

Quelle que soit la taille et l'âge de votre organisation, et que vous ayez ou non le budget pour des outils pour soutenir vos efforts, vous pouvez et devriez mettre en œuvre une gouvernance des données. Avec tous les avantages à obtenir, il serait insensé de ne pas le faire !

Quels sont les défis de la mise en œuvre de la gouvernance des données ?

Voici quelques exemples des pièges à éviter lors de la mise en œuvre :

  • Il est trop tard : Trop souvent, la gouvernance des données ne figure à l'ordre du jour que lorsque les problèmes de qualité des données ont causé des dommages significatifs, ou lorsque de nouveaux systèmes ont échoué en raison d'une mauvaise qualité des données.

  • Silo de responsabilité : De nombreux utilisateurs professionnels croient (à tort) que l'IT possède toutes les données. Utilisez vos rôles de gouvernance des données pour clarifier qui est responsable de quoi. Bien faite, la gouvernance des données brise les silos et améliore la collaboration au sein de l'organisation.

  • Appliquer des solutions à court terme au détriment de la stratégie à long terme : La gouvernance des données peut prendre du temps à mettre en place et à apporter de la valeur, donc la tendance à opter pour des solutions rapides est compréhensible. Cependant, les solutions tactiques à court terme doivent souvent être répétées régulièrement, ce qui conduit à une culture où le « data wrangling » devient la norme. Nous devons trouver des moyens de fournir de la valeur tout en développant et en mettant en œuvre un cadre de gouvernance des données complet pour assurer une qualité des données proactive et continue.

Si votre organisation possède un cadre de gouvernance des données et que vous avez déjà commencé à surveiller et tester la qualité des données, il y a différents pièges à éviter :

  • Ne pas impliquer l'équipe de gouvernance des données : Cette équipe aide à garantir que vos activités de qualité des données adhèrent à des pratiques holistiques et impliquent toutes les parties prenantes correctes.

  • Laisser tout à l'équipe de gouvernance des données : Ils ne savent pas tout sur toutes les données. Il est important que plusieurs personnes dans l'entreprise élargie, y compris les gestionnaires de données et les analystes de données, soient impliquées.

  • Mauvaise communication : Un manque de communication entre ceux qui dirigent les initiatives de qualité des données, l'équipe de gouvernance des données, et les gestionnaires de données peut entraîner des malentendus et des priorités conflictuelles.

Point de vue d'expert : pourquoi la gouvernance est importante pour l'évolution

Il peut être difficile de convaincre votre organisation de la valeur d'adopter à la fois les pratiques de gouvernance des données et de qualité des données.

Adrian Smith, Responsable des Données chez Creditspring, a vécu ce défi et partage son expérience et ses conseils :

“Dans toutes les organisations que j'ai rencontrées, il semble y avoir une vérité universelle concernant la qualité des données : elle est souvent négligée jusqu'à ce qu'un problème survienne. Qu'il s'agisse de divergences dans les rapports, de processus échouant, ou de résultats de données ressemblant plus à du charabia qu'à des informations précieuses, le problème reste le même.

Initialement, dans les start-ups ou scale-ups, la taille des données est suffisamment petite pour que les anomalies et les valeurs aberrantes puissent être corrigées manuellement. Cependant, à mesure que l'organisation s'étend, le volume de données explose et les complexités de sa gestion se multiplient à un rythme qui dépasse à la fois la mise en œuvre de cadres de gouvernance des données et l'expansion des ressources de gestion des données.

Cette phase de croissance voit souvent les ressources être étirées au maximum, car l'accent est fermement mis sur le soutien à l'entreprise en pleine expansion — pourquoi s'inquiéter de demain alors que les défis d'aujourd'hui sont suffisamment pressants ? Pourtant, cette approche sème les graines de problèmes futurs.

Les organisations plus grandes et plus matures ont appris cette leçon à leurs dépens et ont réagi en créant des rôles comme des champions des données ou gestionnaires de données, qui assument la propriété et la responsabilité des données, les traitant comme l'actif essentiel qu'elles sont.

En revanche, dans de nombreuses start-ups, les données sont initialement perçues comme un sous-produit des processus opérationnels, non pas comme un actif à part entière. La propriété revient par défaut au département IT, qui est censé

Comme la question proverbiale de savoir ce qui est apparu en premier, la poule ou l'œuf, de nombreuses personnes dans la communauté de gestion des données se demandent, lequel devrait venir en premier, la qualité des données ou la gouvernance des données ?

Ce n'est pas une question facile à répondre. La plupart d'entre nous comprennent ce qu'est la qualité des données - « des données suffisamment bonnes pour être utilisées » est un concept assez simple à saisir. La gouvernance des données, en revanche, semble être quelque chose qui vous empêche de faire votre travail et, soyons honnêtes, cela semble aussi plutôt ennuyeux ! Mais ce n'est pas vrai ; la gouvernance des données consiste à comprendre les données que votre organisation possède et à avoir un cadre structuré de rôles et de responsabilités pour les gérer. Cela garantit que les bonnes personnes peuvent prendre des décisions cohérentes concernant la qualité et l'utilisation de vos données.

La qualité des données garantit des données précises, complètes et fiables, tandis que la gouvernance des données fournit les politiques, les rôles et les cadres pour les gérer.

La gestion de la qualité des données et la gouvernance des données sont toutes deux des activités critiques de gestion des données. Après tout, il n'y a pas beaucoup d'intérêt à gérer vos données si vous n'êtes pas sûr qu'il s'agisse des bonnes données ou si elles sont d'une qualité suffisante pour être utilisées.

Bien faites, la gestion de la qualité des données et la gouvernance assurent que les bonnes données de la bonne qualité sont disponibles pour les personnes et les systèmes qui en ont besoin.

Ajoutez d'autres activités de gestion des données au mélange et nous pouvons nous assurer que les données sont sécurisées, stockées de manière logique sur les systèmes, et disponibles pour l'analyse et l'apport d'insights.

Qu'est-ce qui vient en premier : la qualité des données ou la gouvernance des données ?

Revenons à notre question d'origine et pourquoi il n'est pas simple d'y répondre. Bien qu'en théorie ce soient deux disciplines distinctes de gestion des données, elles sont profondément interconnectées et vous ne devriez pas en faire une sans l'autre. Je les décris souvent comme symbiotiques — elles se soutiennent mutuellement et idéalement, les deux activités seront menées par la même équipe. Avec cela à l'esprit, vous pouvez voir qu'il est difficile de décider par où commencer.

Dans un monde idéal, nous concevrions et mettrions en œuvre notre cadre de gouvernance des données avant de se concentrer sur la qualité des données.

Malheureusement, nous ne vivons pas dans un monde idéal, et je n'ai jamais rencontré d'organisation qui ait mis en place la gouvernance des données avant de commencer des activités de qualité des données.

Il y a une raison à cela. Il y a toujours des gens dans certaines parties de votre organisation qui comprennent quand les données ne sont pas suffisamment bonnes pour qu'ils fassent leur travail et ils prennent des mesures pour y remédier. Cela conduit à des activités de nettoyage de données ponctuelles, et peut-être à quelques rapports de qualité des données de base mais avec des degrés de succès variés. Hélas, sans une gouvernance des données en place, ces activités ont tendance à être tactiques au mieux et souvent de courte durée dans le cas du reporting de qualité des données.

Pouvez-vous commencer par la qualité des données avant la gouvernance ?

Je ne voudrais jamais critiquer quelqu'un qui a pris l'initiative d'améliorer la qualité des données, mais le faire sans la fondation d'un solide cadre de gouvernance des données conduit à une duplication d'efforts et peut même empirer les choses.

Au fil des ans, j'ai rencontré d'innombrables cas où plusieurs équipes nettoyaient manuellement ou corrigeaient le même ensemble de données, mais pas exactement de la même manière. Cela a abouti à une variété de réponses différentes à des questions de base comme « Combien de clients avons-nous ? » ou « Combien de ventes avons-nous réalisées le mois dernier ? » De grandes quantités de temps sont alors gaspillées alors que différentes équipes participent à des débats animés pour savoir pourquoi leur réponse est la bonne réponse !

Bien que la gouvernance des données soutienne toutes les autres disciplines de gestion des données, l'une des principales raisons pour lesquelles elle est mise en place est de soutenir une meilleure qualité des données.

Avoir une gouvernance des données en place permet une approche proactive à la résolution des problèmes de qualité des données, en corrigeant la source du problème une fois pour toutes.

Cela arrête le cycle sans fin de nettoyage des données continu et de débats sans fin sur les données qui sont vraiment correctes.

Mais pourquoi commencer par la gouvernance des données ?

Eh bien, une partie clé de la gouvernance des données est un catalogue de données.

Un catalogue de données nous aide à comprendre et à définir les données que nous avons. C'est un inventaire centralisé et consultable des actifs de données d'une organisation qui utilise des métadonnées pour aider les utilisateurs à découvrir, comprendre et gouverner les données efficacement.

Après tout, comment pouvons-nous définir les règles de qualité des données si personne ne peut s'entendre sur ce que sont ces données en premier lieu ?

Tout le monde pense savoir ce que sont les données, mais ce n'est qu'en commençant à documenter les définitions des données que vous réalisez que les gens ont des points de vue différents. Ces points de vue différents peuvent causer une foule de problèmes et d'inefficiences et doivent être exposés et résolus.

Avoir une gouvernance des données en place en premier lieu garantit que les bonnes personnes prennent les décisions concernant les règles de qualité des données.

C'est particulièrement important pour les données utilisées par plusieurs personnes à travers une organisation. Sans un propriétaire des données, de nombreuses équipes prennent des décisions contradictoires sur ce qui est acceptable pour la qualité d'un produit de données.

Il est important de concevoir une structure de propriétaires de données et de gestionnaires de données qui peuvent travailler à travers les silos organisationnels et encourager la communication, de sorte que toutes les décisions concernant la qualité des données tiennent compte des besoins de tout le monde.

Quels sont les défis de la mise en œuvre de la gouvernance en premier ?

Il est facile de dire que nous devrions faire la gouvernance des données en premier, mais ce n'est pas toujours aussi simple. Si vous travaillez dans une organisation distribuée, il peut ne pas être facile de s'accorder sur un seul propriétaire de données pour des données largement utilisées. Cela peut sembler plus facile de laisser tout le monde faire à sa guise, mais cela ne mène pas à des résultats positifs à long terme.

Malheureusement, peu d'organisations ont le luxe de pouvoir mettre en œuvre une gouvernance des données avant de commencer les activités de qualité des données. La seule exception est les start-ups.

J'ai discuté avec des personnes dans plusieurs start-ups au fil des ans et bien qu'elles démarrent d'une feuille blanche, elles sont généralement contraintes par la nécessité d'être aussi économes que possible. Cela signifie qu'elles ne sont pas toujours ouvertes à la définition des données avant de commencer à les utiliser.

Comment pouvez-vous surmonter ces obstacles ?

Vous devez associer la mise en œuvre des activités de gouvernance des données et de qualité des données aux objectifs globaux de l'entreprise. Expliquez que si vous mettez en œuvre de solides pratiques de gestion des données maintenant, vous pouvez éviter les problèmes futurs et, plus important encore, augmenter les chances de succès de l'organisation.

Rappelez-vous, la gouvernance des données peut sembler être une activité de conformité, mais en réalité, lorsqu'elle est bien faite, elle apporte une valeur commerciale réelle.

Quand devrais-je mettre en œuvre la gouvernance des données ?

Si vous travaillez dans une start-up : faites-le tôt ; si vous ne l'êtes pas, mettez-le en œuvre dès que possible.

Les avantages de la mise en œuvre incluent :

  • faciliter l'automatisation

  • réduire les inefficacités et les coûts

  • simplifier les expériences client

  • améliorer la gestion des risques

Quelle que soit la taille et l'âge de votre organisation, et que vous ayez ou non le budget pour des outils pour soutenir vos efforts, vous pouvez et devriez mettre en œuvre une gouvernance des données. Avec tous les avantages à obtenir, il serait insensé de ne pas le faire !

Quels sont les défis de la mise en œuvre de la gouvernance des données ?

Voici quelques exemples des pièges à éviter lors de la mise en œuvre :

  • Il est trop tard : Trop souvent, la gouvernance des données ne figure à l'ordre du jour que lorsque les problèmes de qualité des données ont causé des dommages significatifs, ou lorsque de nouveaux systèmes ont échoué en raison d'une mauvaise qualité des données.

  • Silo de responsabilité : De nombreux utilisateurs professionnels croient (à tort) que l'IT possède toutes les données. Utilisez vos rôles de gouvernance des données pour clarifier qui est responsable de quoi. Bien faite, la gouvernance des données brise les silos et améliore la collaboration au sein de l'organisation.

  • Appliquer des solutions à court terme au détriment de la stratégie à long terme : La gouvernance des données peut prendre du temps à mettre en place et à apporter de la valeur, donc la tendance à opter pour des solutions rapides est compréhensible. Cependant, les solutions tactiques à court terme doivent souvent être répétées régulièrement, ce qui conduit à une culture où le « data wrangling » devient la norme. Nous devons trouver des moyens de fournir de la valeur tout en développant et en mettant en œuvre un cadre de gouvernance des données complet pour assurer une qualité des données proactive et continue.

Si votre organisation possède un cadre de gouvernance des données et que vous avez déjà commencé à surveiller et tester la qualité des données, il y a différents pièges à éviter :

  • Ne pas impliquer l'équipe de gouvernance des données : Cette équipe aide à garantir que vos activités de qualité des données adhèrent à des pratiques holistiques et impliquent toutes les parties prenantes correctes.

  • Laisser tout à l'équipe de gouvernance des données : Ils ne savent pas tout sur toutes les données. Il est important que plusieurs personnes dans l'entreprise élargie, y compris les gestionnaires de données et les analystes de données, soient impliquées.

  • Mauvaise communication : Un manque de communication entre ceux qui dirigent les initiatives de qualité des données, l'équipe de gouvernance des données, et les gestionnaires de données peut entraîner des malentendus et des priorités conflictuelles.

Point de vue d'expert : pourquoi la gouvernance est importante pour l'évolution

Il peut être difficile de convaincre votre organisation de la valeur d'adopter à la fois les pratiques de gouvernance des données et de qualité des données.

Adrian Smith, Responsable des Données chez Creditspring, a vécu ce défi et partage son expérience et ses conseils :

“Dans toutes les organisations que j'ai rencontrées, il semble y avoir une vérité universelle concernant la qualité des données : elle est souvent négligée jusqu'à ce qu'un problème survienne. Qu'il s'agisse de divergences dans les rapports, de processus échouant, ou de résultats de données ressemblant plus à du charabia qu'à des informations précieuses, le problème reste le même.

Initialement, dans les start-ups ou scale-ups, la taille des données est suffisamment petite pour que les anomalies et les valeurs aberrantes puissent être corrigées manuellement. Cependant, à mesure que l'organisation s'étend, le volume de données explose et les complexités de sa gestion se multiplient à un rythme qui dépasse à la fois la mise en œuvre de cadres de gouvernance des données et l'expansion des ressources de gestion des données.

Cette phase de croissance voit souvent les ressources être étirées au maximum, car l'accent est fermement mis sur le soutien à l'entreprise en pleine expansion — pourquoi s'inquiéter de demain alors que les défis d'aujourd'hui sont suffisamment pressants ? Pourtant, cette approche sème les graines de problèmes futurs.

Les organisations plus grandes et plus matures ont appris cette leçon à leurs dépens et ont réagi en créant des rôles comme des champions des données ou gestionnaires de données, qui assument la propriété et la responsabilité des données, les traitant comme l'actif essentiel qu'elles sont.

En revanche, dans de nombreuses start-ups, les données sont initialement perçues comme un sous-produit des processus opérationnels, non pas comme un actif à part entière. La propriété revient par défaut au département IT, qui est censé

Comme la question proverbiale de savoir ce qui est apparu en premier, la poule ou l'œuf, de nombreuses personnes dans la communauté de gestion des données se demandent, lequel devrait venir en premier, la qualité des données ou la gouvernance des données ?

Ce n'est pas une question facile à répondre. La plupart d'entre nous comprennent ce qu'est la qualité des données - « des données suffisamment bonnes pour être utilisées » est un concept assez simple à saisir. La gouvernance des données, en revanche, semble être quelque chose qui vous empêche de faire votre travail et, soyons honnêtes, cela semble aussi plutôt ennuyeux ! Mais ce n'est pas vrai ; la gouvernance des données consiste à comprendre les données que votre organisation possède et à avoir un cadre structuré de rôles et de responsabilités pour les gérer. Cela garantit que les bonnes personnes peuvent prendre des décisions cohérentes concernant la qualité et l'utilisation de vos données.

La qualité des données garantit des données précises, complètes et fiables, tandis que la gouvernance des données fournit les politiques, les rôles et les cadres pour les gérer.

La gestion de la qualité des données et la gouvernance des données sont toutes deux des activités critiques de gestion des données. Après tout, il n'y a pas beaucoup d'intérêt à gérer vos données si vous n'êtes pas sûr qu'il s'agisse des bonnes données ou si elles sont d'une qualité suffisante pour être utilisées.

Bien faites, la gestion de la qualité des données et la gouvernance assurent que les bonnes données de la bonne qualité sont disponibles pour les personnes et les systèmes qui en ont besoin.

Ajoutez d'autres activités de gestion des données au mélange et nous pouvons nous assurer que les données sont sécurisées, stockées de manière logique sur les systèmes, et disponibles pour l'analyse et l'apport d'insights.

Qu'est-ce qui vient en premier : la qualité des données ou la gouvernance des données ?

Revenons à notre question d'origine et pourquoi il n'est pas simple d'y répondre. Bien qu'en théorie ce soient deux disciplines distinctes de gestion des données, elles sont profondément interconnectées et vous ne devriez pas en faire une sans l'autre. Je les décris souvent comme symbiotiques — elles se soutiennent mutuellement et idéalement, les deux activités seront menées par la même équipe. Avec cela à l'esprit, vous pouvez voir qu'il est difficile de décider par où commencer.

Dans un monde idéal, nous concevrions et mettrions en œuvre notre cadre de gouvernance des données avant de se concentrer sur la qualité des données.

Malheureusement, nous ne vivons pas dans un monde idéal, et je n'ai jamais rencontré d'organisation qui ait mis en place la gouvernance des données avant de commencer des activités de qualité des données.

Il y a une raison à cela. Il y a toujours des gens dans certaines parties de votre organisation qui comprennent quand les données ne sont pas suffisamment bonnes pour qu'ils fassent leur travail et ils prennent des mesures pour y remédier. Cela conduit à des activités de nettoyage de données ponctuelles, et peut-être à quelques rapports de qualité des données de base mais avec des degrés de succès variés. Hélas, sans une gouvernance des données en place, ces activités ont tendance à être tactiques au mieux et souvent de courte durée dans le cas du reporting de qualité des données.

Pouvez-vous commencer par la qualité des données avant la gouvernance ?

Je ne voudrais jamais critiquer quelqu'un qui a pris l'initiative d'améliorer la qualité des données, mais le faire sans la fondation d'un solide cadre de gouvernance des données conduit à une duplication d'efforts et peut même empirer les choses.

Au fil des ans, j'ai rencontré d'innombrables cas où plusieurs équipes nettoyaient manuellement ou corrigeaient le même ensemble de données, mais pas exactement de la même manière. Cela a abouti à une variété de réponses différentes à des questions de base comme « Combien de clients avons-nous ? » ou « Combien de ventes avons-nous réalisées le mois dernier ? » De grandes quantités de temps sont alors gaspillées alors que différentes équipes participent à des débats animés pour savoir pourquoi leur réponse est la bonne réponse !

Bien que la gouvernance des données soutienne toutes les autres disciplines de gestion des données, l'une des principales raisons pour lesquelles elle est mise en place est de soutenir une meilleure qualité des données.

Avoir une gouvernance des données en place permet une approche proactive à la résolution des problèmes de qualité des données, en corrigeant la source du problème une fois pour toutes.

Cela arrête le cycle sans fin de nettoyage des données continu et de débats sans fin sur les données qui sont vraiment correctes.

Mais pourquoi commencer par la gouvernance des données ?

Eh bien, une partie clé de la gouvernance des données est un catalogue de données.

Un catalogue de données nous aide à comprendre et à définir les données que nous avons. C'est un inventaire centralisé et consultable des actifs de données d'une organisation qui utilise des métadonnées pour aider les utilisateurs à découvrir, comprendre et gouverner les données efficacement.

Après tout, comment pouvons-nous définir les règles de qualité des données si personne ne peut s'entendre sur ce que sont ces données en premier lieu ?

Tout le monde pense savoir ce que sont les données, mais ce n'est qu'en commençant à documenter les définitions des données que vous réalisez que les gens ont des points de vue différents. Ces points de vue différents peuvent causer une foule de problèmes et d'inefficiences et doivent être exposés et résolus.

Avoir une gouvernance des données en place en premier lieu garantit que les bonnes personnes prennent les décisions concernant les règles de qualité des données.

C'est particulièrement important pour les données utilisées par plusieurs personnes à travers une organisation. Sans un propriétaire des données, de nombreuses équipes prennent des décisions contradictoires sur ce qui est acceptable pour la qualité d'un produit de données.

Il est important de concevoir une structure de propriétaires de données et de gestionnaires de données qui peuvent travailler à travers les silos organisationnels et encourager la communication, de sorte que toutes les décisions concernant la qualité des données tiennent compte des besoins de tout le monde.

Quels sont les défis de la mise en œuvre de la gouvernance en premier ?

Il est facile de dire que nous devrions faire la gouvernance des données en premier, mais ce n'est pas toujours aussi simple. Si vous travaillez dans une organisation distribuée, il peut ne pas être facile de s'accorder sur un seul propriétaire de données pour des données largement utilisées. Cela peut sembler plus facile de laisser tout le monde faire à sa guise, mais cela ne mène pas à des résultats positifs à long terme.

Malheureusement, peu d'organisations ont le luxe de pouvoir mettre en œuvre une gouvernance des données avant de commencer les activités de qualité des données. La seule exception est les start-ups.

J'ai discuté avec des personnes dans plusieurs start-ups au fil des ans et bien qu'elles démarrent d'une feuille blanche, elles sont généralement contraintes par la nécessité d'être aussi économes que possible. Cela signifie qu'elles ne sont pas toujours ouvertes à la définition des données avant de commencer à les utiliser.

Comment pouvez-vous surmonter ces obstacles ?

Vous devez associer la mise en œuvre des activités de gouvernance des données et de qualité des données aux objectifs globaux de l'entreprise. Expliquez que si vous mettez en œuvre de solides pratiques de gestion des données maintenant, vous pouvez éviter les problèmes futurs et, plus important encore, augmenter les chances de succès de l'organisation.

Rappelez-vous, la gouvernance des données peut sembler être une activité de conformité, mais en réalité, lorsqu'elle est bien faite, elle apporte une valeur commerciale réelle.

Quand devrais-je mettre en œuvre la gouvernance des données ?

Si vous travaillez dans une start-up : faites-le tôt ; si vous ne l'êtes pas, mettez-le en œuvre dès que possible.

Les avantages de la mise en œuvre incluent :

  • faciliter l'automatisation

  • réduire les inefficacités et les coûts

  • simplifier les expériences client

  • améliorer la gestion des risques

Quelle que soit la taille et l'âge de votre organisation, et que vous ayez ou non le budget pour des outils pour soutenir vos efforts, vous pouvez et devriez mettre en œuvre une gouvernance des données. Avec tous les avantages à obtenir, il serait insensé de ne pas le faire !

Quels sont les défis de la mise en œuvre de la gouvernance des données ?

Voici quelques exemples des pièges à éviter lors de la mise en œuvre :

  • Il est trop tard : Trop souvent, la gouvernance des données ne figure à l'ordre du jour que lorsque les problèmes de qualité des données ont causé des dommages significatifs, ou lorsque de nouveaux systèmes ont échoué en raison d'une mauvaise qualité des données.

  • Silo de responsabilité : De nombreux utilisateurs professionnels croient (à tort) que l'IT possède toutes les données. Utilisez vos rôles de gouvernance des données pour clarifier qui est responsable de quoi. Bien faite, la gouvernance des données brise les silos et améliore la collaboration au sein de l'organisation.

  • Appliquer des solutions à court terme au détriment de la stratégie à long terme : La gouvernance des données peut prendre du temps à mettre en place et à apporter de la valeur, donc la tendance à opter pour des solutions rapides est compréhensible. Cependant, les solutions tactiques à court terme doivent souvent être répétées régulièrement, ce qui conduit à une culture où le « data wrangling » devient la norme. Nous devons trouver des moyens de fournir de la valeur tout en développant et en mettant en œuvre un cadre de gouvernance des données complet pour assurer une qualité des données proactive et continue.

Si votre organisation possède un cadre de gouvernance des données et que vous avez déjà commencé à surveiller et tester la qualité des données, il y a différents pièges à éviter :

  • Ne pas impliquer l'équipe de gouvernance des données : Cette équipe aide à garantir que vos activités de qualité des données adhèrent à des pratiques holistiques et impliquent toutes les parties prenantes correctes.

  • Laisser tout à l'équipe de gouvernance des données : Ils ne savent pas tout sur toutes les données. Il est important que plusieurs personnes dans l'entreprise élargie, y compris les gestionnaires de données et les analystes de données, soient impliquées.

  • Mauvaise communication : Un manque de communication entre ceux qui dirigent les initiatives de qualité des données, l'équipe de gouvernance des données, et les gestionnaires de données peut entraîner des malentendus et des priorités conflictuelles.

Point de vue d'expert : pourquoi la gouvernance est importante pour l'évolution

Il peut être difficile de convaincre votre organisation de la valeur d'adopter à la fois les pratiques de gouvernance des données et de qualité des données.

Adrian Smith, Responsable des Données chez Creditspring, a vécu ce défi et partage son expérience et ses conseils :

“Dans toutes les organisations que j'ai rencontrées, il semble y avoir une vérité universelle concernant la qualité des données : elle est souvent négligée jusqu'à ce qu'un problème survienne. Qu'il s'agisse de divergences dans les rapports, de processus échouant, ou de résultats de données ressemblant plus à du charabia qu'à des informations précieuses, le problème reste le même.

Initialement, dans les start-ups ou scale-ups, la taille des données est suffisamment petite pour que les anomalies et les valeurs aberrantes puissent être corrigées manuellement. Cependant, à mesure que l'organisation s'étend, le volume de données explose et les complexités de sa gestion se multiplient à un rythme qui dépasse à la fois la mise en œuvre de cadres de gouvernance des données et l'expansion des ressources de gestion des données.

Cette phase de croissance voit souvent les ressources être étirées au maximum, car l'accent est fermement mis sur le soutien à l'entreprise en pleine expansion — pourquoi s'inquiéter de demain alors que les défis d'aujourd'hui sont suffisamment pressants ? Pourtant, cette approche sème les graines de problèmes futurs.

Les organisations plus grandes et plus matures ont appris cette leçon à leurs dépens et ont réagi en créant des rôles comme des champions des données ou gestionnaires de données, qui assument la propriété et la responsabilité des données, les traitant comme l'actif essentiel qu'elles sont.

En revanche, dans de nombreuses start-ups, les données sont initialement perçues comme un sous-produit des processus opérationnels, non pas comme un actif à part entière. La propriété revient par défaut au département IT, qui est censé

Trusted by the world’s leading enterprises

Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.

At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava

Director of Data Governance, Quality and MLOps

Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake

Director of Product-Data Platform

Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta

Data Engineering Manager

Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie

Head of Data Engineering

4,4 sur 5

Commencez à faire confiance à vos données. Aujourd'hui.

Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.

Adopté par

Trusted by the world’s leading enterprises

Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.

At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava

Director of Data Governance, Quality and MLOps

Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake

Director of Product-Data Platform

Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta

Data Engineering Manager

Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie

Head of Data Engineering

4,4 sur 5

Commencez à faire confiance à vos données. Aujourd'hui.

Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.

Adopté par

Trusted by the world’s leading enterprises

Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.

At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava

Director of Data Governance, Quality and MLOps

Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake

Director of Product-Data Platform

Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta

Data Engineering Manager

Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie

Head of Data Engineering

4,4 sur 5

Commencez à faire confiance à vos données. Aujourd'hui.

Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.

Adopté par