Gouvernance de l'IA & Qualité des données : Principes et Checklist pratiques
Gouvernance de l'IA & Qualité des données : Principes et Checklist pratiques
17 mai 2024

Nicola Askham
Nicola Askham
Nicola Askham
Le Coach de Gouvernance des Données
Le Coach de Gouvernance des Données
Le Coach de Gouvernance des Données

Natasha Lauer
Natasha Lauer
Natasha Lauer
Ancien Responsable Marketing chez Soda
Ancien Responsable Marketing chez Soda
Ancien Responsable Marketing chez Soda
Table des matières



Sans aucun doute, l'ingestion de données de haute qualité et bien gouvernées améliore la précision des modèles d'IA. Avoir une bonne qualité de données est fondamental pour entraîner les modèles d'IA et obtenir les résultats souhaités.
Après tout, comment pouvez-vous faire confiance aux données que les modèles GenAI créent si les données sous-jacentes sont de mauvaise qualité?
Que ce soit générative ou pas, l'IA ne peut pas fournir les bonnes réponses ni générer de nouvelles perspectives utiles si la qualité des données sous-jacentes est médiocre. L'adage ancien reste vrai : "ordures à l'entrée, ordures à la sortie".
À l'inverse, utiliser des données de bonne qualité assure la confiance humaine dans les modèles d'IA et leurs résultats; ainsi, avoir des données de haute qualité est la fondation pour que les organisations développent et utilisent l'IA en toute confiance.
Dans cet article, nous explorons comment la gouvernance et la qualité se croisent dans l'IA, partageons les principes des praticiens et vous donnons une liste de contrôle pour garantir que vous êtes prêt pour une IA fiable.
Quelle est la différence entre l'IA et GenAI?
L'enthousiasme pour l'intelligence artificielle (IA), et la Generative AI (GenAI) en particulier, croît de manière exponentielle en ce moment. Beaucoup de gens ne comprennent pas la différence entre elles, alors avant d'explorer le rôle de la qualité des données dans l'IA, clarifions ce point. Il semble juste de demander à ChatGPT d'expliquer la différence :
L'IA est un terme large qui couvre tous les aspects des machines émule l'intelligence humaine, tandis que Generative AI se réfère spécifiquement à la branche de l'IA qui se concentre sur la création de nouveaux résultats originaux qui ressemblent aux données d'entraînement sans les reproduire. Cette distinction met en évidence la polyvalence des technologies d'IA et leur potentiel à automatiser des tâches et à favoriser des initiatives créatives.
L'IA existe depuis de nombreuses années et GenAI n'est pas aussi nouvelle que vous pourriez le penser, mais le traitement du langage naturel qui "crée des résultats nouveaux et originaux qui ressemblent aux données d'entraînement" l'a rendue accessible à multitude de personnes et elle a connu une adoption rapide. C'est une époque passionnante avec de nombreuses possibilités de la manière dont nous pouvons utiliser GenAI, entre autres, pour analyser nos données de manière plus rapide et plus facile que jamais.
Ça semble être une bonne chose, mais j'ai quelques préoccupations concernant la vitesse à laquelle elle est adoptée. GenAI est toujours plus excitante que la qualité des données, mais les résultats de l'IA ne sont bons que si le modèle et les données qu'il utilise sont bons.
Pourquoi la Qualité des Données est fondamentale pour l'IA
Dans le résumé ci-dessus, il est clair que l'IA utilise des données d'entraînement pour traiter et préparer des réponses aux entrées. Si ces données d'entraînement ne sont pas de bonne qualité ou même de très mauvaise qualité, GenAI arrive à de mauvaises conclusions, indépendamment de la qualité du modèle.
Les outils GenAI ne sont bons que si les données qu'ils consomment le sont. Par exemple, ChatGPT a été entraîné en utilisant tout ce qui se trouve sur Internet — quelqu'un croit-il que chaque fait sur Internet est correct? Même ChatGPT affiche ce message d'avertissement :
"ChatGPT peut faire des erreurs. Pensez à vérifier les informations importantes."
Les mauvaises données entraînent des résultats incorrects de l'IA, donc il suit que la bonne qualité des données est un élément fondamental pour l'adoption réussie de l'IA. Mais ce n'est pas seulement la qualité des données qui est nécessaire pour réussir avec l'IA, la gouvernance des données est aussi fondamentale.
Le rôle de la Gouvernance des Données dans l'IA
Dans mon dernier article, j'ai discuté de la relation entre la qualité des données et la gouvernance des données. Si il est essentiel qu'une IA saine s'entraîne sur des données de haute qualité et fiables, il suit que la gouvernance des données est aussi cruciale pour soutenir la qualité de ces données.
La gouvernance des données nous aide traditionnellement à comprendre ce que nous possédons, mais son rôle est maintenant plus large et soutient l'utilisation responsable de l'IA. Avec l'IA, nous devons aller un pas plus loin et comprendre ce que nous devrions utiliser ces données pour.
La gouvernance des données joue un rôle crucial dans l'IA en établissant des politiques et procédures claires pour la qualité des données, ce qui est essentiel pour entraîner des modèles d'IA fiables et éthiques.
Elle soutient le succès de l'IA en favorisant la confiance et la transparence dans les applications d'IA parmi les utilisateurs et les parties prenantes. Nous devons avoir confiance que l'IA fera ce qu'il faut et nous donnera les bonnes réponses. Nous devons nous assurer de développer et utiliser correctement GenAI.
Qu'est-ce que la Gouvernance de l'IA?
Il est très clair qu'il existe un interconnexion entre la qualité des données, la gouvernance des données, et l'IA. Ce chevauchement est appelé gouvernance de l'IA.

De la même manière que la gouvernance des données concerne bien plus que les données, la gouvernance de l'IA est bien plus large que juste les modèles d'IA. Sol Rashidi explique bien cela dans son livre, Your AI Survival Guide, lorsqu'elle dit:
"Peu importe votre rôle ou vos raisons, sachez que 70% du succès de votre déploiement d'IA n'a rien à voir avec la technologie. En réalité, la technologie est la partie la plus facile du cycle de vie, la plupart du travail concerne le capital humain et les relations, s'aligner sur les objectifs, surmonter les peurs, choisir la bonne stratégie, le bon cas d'utilisation, et trouver l'ambition."
La gouvernance de l'IA concerne la gestion de l'utilisation éthique, des risques, et des principes associés à l'IA, ce qui inclut nécessairement la gestion de la qualité et de la gouvernance des données sous-jacentes, comme illustré dans le schéma ci-dessus.
Dépendance de l'IA à la Qualité et à la Gouvernance des Données
Les personnes non spécialisées en données pensent souvent que la gouvernance de l'IA concerne uniquement l'éthique et l'évitement de biais involontaires, mais je crois que nos considérations pour adopter et faire confiance à l'IA doivent être plus larges et inclure la gouvernance des données sur lesquelles le modèle s'entraîne, ainsi que le modèle lui-même.
Je ne suis pas seul à penser cela; de plus en plus d'organisations reconnaissent déjà la gouvernance de l'IA comme un sous-ensemble de la gouvernance des données, et l'IA est régulièrement discutée lors des réunions des comités de gouvernance des données.
Mais vous n'avez pas à me croire sur parole. Lara Gureje, fondatrice de DatOculi et ancienne Vice-Présidente de la gouvernance des données d'entreprise au BNP Paribas Bank Group, propose cette perspective sur la qualité des données, la gouvernance des données, et l'IA :
"Au cœur de l'innovation en IA réside une quête incessante d'intelligence. Cependant, ce voyage vers l'intelligence dépend fortement de la qualité et de la gouvernance des données.
Les données gouvernées servent de matériau brut fondamental pour l'optimisation des modèles d'IA et de machine learning (ML). Sans fondation solide, la confiance dans les modèles diminue, rendant les analyses dénuées de sens.
Si les organisations se retrouvent à lutter avec les performances de leurs modèles d'IA et d'analyses, la question fondamentale surgit : "Quelle est la qualité des données alimentées dans ces modèles?" Il est temps que toute organisation cherchant à extraire des insights de ses données reconnaisse la nécessité impérative d'un environnement de données dirigé comme le facteur de succès critique.
La synergie entre l'IA/ML et la gouvernance des données est là où le vrai potentiel des actifs de données est débloqué. Faire de la gouvernance des données une partie intégrante de la culture organisationnelle devient la pierre angulaire pour stimuler l'innovation et extraire une valeur significative des données.
Un fait poignant émerge : le mariage de l'IA/ML et de la gouvernance des données représente le point idéal pour optimiser les actifs de données. C'est une relation symbiotique; on ne peut pas faire l'un sans l'autre.
Pourquoi cela compte?
Reconnaissez qu'il ne s'agit pas du volume de données mais plutôt de sa qualité et de sa fiabilité qui comptent lors de l'alimentation des modèles.
Gérez la santé des ensembles de données pour permettre de découvrir des insights optimaux et de la valeur dans les données.
Assurez-vous d'une utilisation efficace des ressources pour la curation et la collecte des données pour les modèles.
Voici comment optimiser les modèles d'IA/ML en suivant ces étapes pratiques pour intégrer la gouvernance des données dans vos initiatives :
Engagez tôt et lancez la gouvernance des données comme une condition préalable pour les projets d'IA/ML afin d'assurer l'alignement et l'efficacité.
Harmonisez et intégrez les données gouvernées et fiables de manière transparente dans les initiatives d'IA pour améliorer leur efficacité.
Évaluez de manière consistante la qualité des données alimentées dans les modèles et privilégiez les sources de données fiables.
Éduquez les citoyens des données et favorisez une mentalité culturelle de gestion responsable autour des actifs de données pour garantir des pratiques de gouvernance durables.
Mesurez en continu les sorties du modèle par rapport à la qualité des données d'entrée pour conduire à des améliorations.
Établissez des processus formalisés pour la certification et l'attestation des entrées et sorties de données afin de garantir la responsabilité et la fiabilité.
En conclusion, l'avenir de l'IA et du machine learning est prêt à changer et améliorer divers aspects de nos vies. Cependant, pour en débloquer le véritable potentiel, nous devons reconnaître que la qualité des résultats est intrinsèquement liée à la qualité des données d'entrée.
Des données gouvernées génèrent de meilleurs résultats, des données fiables produisent de meilleurs modèles, et de meilleurs modèles fournissent des prédictions d'IA supérieures.
La gouvernance des données occupe un rôle non négociable dans l'amélioration du paysage de l'IA pour le meilleur."
🎧 Vous pouvez écouter Lara et moi discuter de ce sujet en détail sur notre podcast ici.
La nature entrelacée de la qualité des données, de la gouvernance des données et de la gouvernance de l'IA signifie qu'il est vital d'embrasser les trois pour garantir une utilisation responsable et éthique de l'IA. Comme mon ami Tudor Borlea a dit :
"La Generative AI croît si rapidement que si vous ne vous en saisissez pas tôt avec la gouvernance, elle vous explosera au visage."
Alors, si votre organisation a déjà adopté ou est sur le point d'adopter GenAI, assurez-vous que vous pensez à la gouvernance de l'IA.
La gouvernance de l'IA est aussi vitale que les initiatives qui croissent rapidement en échelle et usage. Pour la gérer de manière responsable, nous devrions adopter la même approche que pour tout autre actif de notre organisation et le faire de manière intentionnelle et réfléchie.
Peut-être que l'emploi du mot "gouvernance" donne l'impression incorrecte que la gouvernance de l'IA concerne uniquement l'arrêt des gens de créer et d'utiliser des modèles d'IA, mais en réalité, cela se limite à nous assurer que nous faisons de notre mieux pour faire les choses correctement.
Les modèles d'IA prennent des décisions à grande vitesse et avec cette rapidité viennent de plus grands risques. La gouvernance est nécessaire pour garantir qu'il existe des principes et directives appropriés en place pour assurer le développement responsable de l'IA et l'utilisation de ses résultats.
Principes Fondamentaux pour Gouvernance de l'IA + Données
Il y a quelques mois, j'ai interviewé le Responsable de la Gouvernance des Données et de l'IA de Sony Europe, Sayantan Chaklader dans mon podcast, The Data Governance Podcast. Il était d'accord avec moi que les principes de gouvernance pour l'IA sont très similaires à ceux pour la gouvernance des données. Comme mentionné ci-dessus, il s'agit de faire la bonne chose de la bonne manière, que l'on parle de données ou d'IA.
Ce qui suit sont plusieurs principes que vous pourriez vouloir envisager pour votre approche de la gouvernance de l'IA.
Propriété: Assurez une propriété et une responsabilité appropriées pour les modèles d'IA et leurs résultats.
Transparence: Le but et la logique du modèle doivent être explicables et documentés.
Documentation: Sources des données comprises et documentées.
Pertinence: La qualité des données sources étant adaptée à son objectif.
Sécurité: Les données utilisées dans les modèles doivent être sécurisées de la même manière qu'elles le sont dans les autres systèmes de nos organisations.
Confidentialité: L'utilisation de données personnelles dans les modèles doit être conforme aux régulations de protection et de confidentialité des données.
Autonomisation: Une formation devrait être fournie à tous les utilisateurs de l'IA pour construire une compréhension de l'utilisation acceptable de l'IA. (D'expérience, cela fonctionne bien dans le cadre d'une formation à la culture de données.)
Cette liste se concentre sur le côté données de la gouvernance de l'IA, mais vous aurez également besoin de principes qui traitent de l'utilisation éthique, de la conformité réglementaire (comme certaines des dispositions de la EU AI Act qui entreront en vigueur plus tard cette année), et de la gestion des risques.
Alors que certains des principes ci-dessus concernent la sécurité des données et la protection des données, le reste des principes est identique, ou très similaire, à ceux d'un cadre de gouvernance des données. C'est pourquoi je crois fermement que vous n'avez pas besoin de créer un cadre séparé juste pour la gouvernance de l'IA.
Tout comme la qualité des données est couverte par votre cadre de gouvernance des données, vous devriez étendre sa portée pour couvrir l'IA. Cela est plus facile que de concevoir un autre cadre à partir de zéro, ce sera beaucoup plus simple pour vos parties prenantes commerciales de se l'approprier, et c'est beaucoup plus simple que d'avoir plusieurs cadres qui couvrent différentes choses.
Comment Commencer: Étapes vers la Gouvernance de l'IA
Alors, quelles mesures pouvez-vous prendre pour commencer votre voyage vers une gouvernance de l'IA responsable? Vous n'allez pas pouvoir concevoir et mettre en œuvre un programme du jour au lendemain, mais je commencerais le processus avec les étapes suivantes :
Favoriser une culture d'utilisation responsable de l'IA. Mettre en place une gouvernance formelle est susceptible de prendre du temps, alors commencez petit en incitant tout le monde à penser intentionnellement à l'utilisation de l'IA.
Ajouter la gouvernance de l'IA à votre agenda de gouvernance des données. Faites parler vos parties prenantes senior à ce sujet et comprendre son importance.
Créer et délivrer une formation à la culture de données qui inclut une sensibilisation à l'IA. Elle doit couvrir ce qu'ils peuvent et ne peuvent pas faire avec GenAI. Trop d'organisations déploient des outils comme Microsoft Co-Pilot sans aucune orientation pour le personnel sur ce qu'il devrait et, surtout, ne devrait pas être utilisé.
Évaluer l'utilisation actuelle de l'IA par votre organisation et les risques de son utilisation. Est-ce que cela correspond à l'appétit pour le risque actuel de votre organisation?
Développer votre politique de gouvernance de l'IA. Déterminez ce que vous voulez atteindre avec la gouvernance de l'IA, par exemple assurer une utilisation éthique, une conformité avec les réglementations, promouvoir la transparence, et se prémunir contre les biais.
Coordonnez votre approche de gouvernance de l'IA avec votre approche et cadre de gouvernance des données pour s'assurer que la qualité des données, la gouvernance des données et la gouvernance de l'IA sont entièrement alignées. Dans la mesure du possible, élargissez la portée de votre équipe et de vos processus de gouvernance des données existants pour inclure l'IA.
Former ou ajouter une expertise en IA à votre équipe de gouvernance des données.
Votre organisation est-elle prête à embrasser l'IA?
Reconnaissons-le : GenAI devient rapidement partie intégrante des opérations quotidiennes dans une grande et diverse collection d'industries. Les possibilités associées à l'adoption de GenAI sont très excitantes, à condition qu'elle soit embrassée de la bonne manière.
Dans une enquête récente sur la gouvernance des données que j'ai menée avec Baringa Partners, nous avons posé aux participants quelques questions sur l'IA et avons été surpris que seulement un peu plus de la moitié des répondants ait pris en considération l'impact de l'adoption de l'IA par leur organisation sur leur approche de gouvernance des données. Malgré ce nombre inférieur aux attentes, de nombreux répondants ont ajouté des commentaires pour souligner qu'ils estimaient que les activités d'IA et de gouvernance des données doivent être alignées et intégrées, tandis que certains ont exprimé des préoccupations que la qualité de leurs données n'était pas actuellement suffisante pour soutenir des initiatives d'IA.
L'enquête a également demandé des avis sur la capacité des équipes à gérer la qualité des données, et d'autres activités de gestion des données, sans IA. Plus de 70% pensaient qu'elles le pouvaient, et bien que jusqu'à récemment il y ait eu peu d'options pour utiliser l'IA dans ces activités, je pense qu'il est important de chercher des opportunités pour utiliser l'IA pour accélérer ces activités. Mais je reviendrai là-dessus dans mon prochain blog.
Dans un esprit similaire, il est intéressant de noter que Soda, une entreprise dont le logiciel est à la pointe de la qualité des données avec GenAI, a récemment mené un sondage sur LinkedIn pour voir si les gens pensaient que GenAI va perturber le workflow de la qualité des données, et les résultats ont montré des avis quelque peu partagés et finalement indécis. Il semble que ce soit une question de "attendre pour voir!"
C'est une période passionnante et GenAI va certainement impacter nos activités de qualité des données, donc nous devons nous assurer d'être prêts pour cela. Pour vous aider à démarrer, utilisez cette liste de vérification pour déterminer si les données de votre organisation sont prêtes à embrasser l'IA.
Liste de Vérification : Vos données sont-elles prêtes pour l'IA?
[ ] Avez-vous déjà mis en place un cadre de gouvernance des données avec des rôles, responsabilités, et processus documentés?
[ ] La gouvernance des données est-elle intégrée dans vos processus de projet et de gestion du changement?
[ ] Avez-vous un processus pour identifier et classer les données les plus importantes?
[ ] Utilisez-vous un catalogue de données?
[ ] Avez-vous des processus pour surveiller la qualité des données importantes?
[ ] Avez-vous des processus en place pour traiter les données de mauvaise qualité et les problèmes de données?
[ ] Avez-vous quelque chose en place qui offre une observabilité des données pour vous aider à surveiller la fiabilité des données?
[ ] Avez-vous un niveau raisonnable de culture de données à travers l'organisation?
Si vous avez répondu "non" à l'une de ces questions, il est temps d'agir.
Agissez!
Découvrez la plateforme de qualité des données de Soda pour préparer vos données à l'IA.
Bonne chance!
À propos de l'Auteur
En collaboration avec Soda, Nicola Askham, connue comme The Data Governance Coach, a rédigé une série complète en trois parties qui aborde des sujets critiques incluant la gouvernance des données, l'IA et la qualité des données.
Nicola se spécialise dans l'aide aux organisations pour améliorer leurs pratiques de gestion des données. Au cours des vingt dernières années, elle a aidé de nombreuses entreprises à réduire les coûts et les inefficacités grâce à ses initiatives de coaching, de conseil et de formation dédiées.
Sans aucun doute, l'ingestion de données de haute qualité et bien gouvernées améliore la précision des modèles d'IA. Avoir une bonne qualité de données est fondamental pour entraîner les modèles d'IA et obtenir les résultats souhaités.
Après tout, comment pouvez-vous faire confiance aux données que les modèles GenAI créent si les données sous-jacentes sont de mauvaise qualité?
Que ce soit générative ou pas, l'IA ne peut pas fournir les bonnes réponses ni générer de nouvelles perspectives utiles si la qualité des données sous-jacentes est médiocre. L'adage ancien reste vrai : "ordures à l'entrée, ordures à la sortie".
À l'inverse, utiliser des données de bonne qualité assure la confiance humaine dans les modèles d'IA et leurs résultats; ainsi, avoir des données de haute qualité est la fondation pour que les organisations développent et utilisent l'IA en toute confiance.
Dans cet article, nous explorons comment la gouvernance et la qualité se croisent dans l'IA, partageons les principes des praticiens et vous donnons une liste de contrôle pour garantir que vous êtes prêt pour une IA fiable.
Quelle est la différence entre l'IA et GenAI?
L'enthousiasme pour l'intelligence artificielle (IA), et la Generative AI (GenAI) en particulier, croît de manière exponentielle en ce moment. Beaucoup de gens ne comprennent pas la différence entre elles, alors avant d'explorer le rôle de la qualité des données dans l'IA, clarifions ce point. Il semble juste de demander à ChatGPT d'expliquer la différence :
L'IA est un terme large qui couvre tous les aspects des machines émule l'intelligence humaine, tandis que Generative AI se réfère spécifiquement à la branche de l'IA qui se concentre sur la création de nouveaux résultats originaux qui ressemblent aux données d'entraînement sans les reproduire. Cette distinction met en évidence la polyvalence des technologies d'IA et leur potentiel à automatiser des tâches et à favoriser des initiatives créatives.
L'IA existe depuis de nombreuses années et GenAI n'est pas aussi nouvelle que vous pourriez le penser, mais le traitement du langage naturel qui "crée des résultats nouveaux et originaux qui ressemblent aux données d'entraînement" l'a rendue accessible à multitude de personnes et elle a connu une adoption rapide. C'est une époque passionnante avec de nombreuses possibilités de la manière dont nous pouvons utiliser GenAI, entre autres, pour analyser nos données de manière plus rapide et plus facile que jamais.
Ça semble être une bonne chose, mais j'ai quelques préoccupations concernant la vitesse à laquelle elle est adoptée. GenAI est toujours plus excitante que la qualité des données, mais les résultats de l'IA ne sont bons que si le modèle et les données qu'il utilise sont bons.
Pourquoi la Qualité des Données est fondamentale pour l'IA
Dans le résumé ci-dessus, il est clair que l'IA utilise des données d'entraînement pour traiter et préparer des réponses aux entrées. Si ces données d'entraînement ne sont pas de bonne qualité ou même de très mauvaise qualité, GenAI arrive à de mauvaises conclusions, indépendamment de la qualité du modèle.
Les outils GenAI ne sont bons que si les données qu'ils consomment le sont. Par exemple, ChatGPT a été entraîné en utilisant tout ce qui se trouve sur Internet — quelqu'un croit-il que chaque fait sur Internet est correct? Même ChatGPT affiche ce message d'avertissement :
"ChatGPT peut faire des erreurs. Pensez à vérifier les informations importantes."
Les mauvaises données entraînent des résultats incorrects de l'IA, donc il suit que la bonne qualité des données est un élément fondamental pour l'adoption réussie de l'IA. Mais ce n'est pas seulement la qualité des données qui est nécessaire pour réussir avec l'IA, la gouvernance des données est aussi fondamentale.
Le rôle de la Gouvernance des Données dans l'IA
Dans mon dernier article, j'ai discuté de la relation entre la qualité des données et la gouvernance des données. Si il est essentiel qu'une IA saine s'entraîne sur des données de haute qualité et fiables, il suit que la gouvernance des données est aussi cruciale pour soutenir la qualité de ces données.
La gouvernance des données nous aide traditionnellement à comprendre ce que nous possédons, mais son rôle est maintenant plus large et soutient l'utilisation responsable de l'IA. Avec l'IA, nous devons aller un pas plus loin et comprendre ce que nous devrions utiliser ces données pour.
La gouvernance des données joue un rôle crucial dans l'IA en établissant des politiques et procédures claires pour la qualité des données, ce qui est essentiel pour entraîner des modèles d'IA fiables et éthiques.
Elle soutient le succès de l'IA en favorisant la confiance et la transparence dans les applications d'IA parmi les utilisateurs et les parties prenantes. Nous devons avoir confiance que l'IA fera ce qu'il faut et nous donnera les bonnes réponses. Nous devons nous assurer de développer et utiliser correctement GenAI.
Qu'est-ce que la Gouvernance de l'IA?
Il est très clair qu'il existe un interconnexion entre la qualité des données, la gouvernance des données, et l'IA. Ce chevauchement est appelé gouvernance de l'IA.

De la même manière que la gouvernance des données concerne bien plus que les données, la gouvernance de l'IA est bien plus large que juste les modèles d'IA. Sol Rashidi explique bien cela dans son livre, Your AI Survival Guide, lorsqu'elle dit:
"Peu importe votre rôle ou vos raisons, sachez que 70% du succès de votre déploiement d'IA n'a rien à voir avec la technologie. En réalité, la technologie est la partie la plus facile du cycle de vie, la plupart du travail concerne le capital humain et les relations, s'aligner sur les objectifs, surmonter les peurs, choisir la bonne stratégie, le bon cas d'utilisation, et trouver l'ambition."
La gouvernance de l'IA concerne la gestion de l'utilisation éthique, des risques, et des principes associés à l'IA, ce qui inclut nécessairement la gestion de la qualité et de la gouvernance des données sous-jacentes, comme illustré dans le schéma ci-dessus.
Dépendance de l'IA à la Qualité et à la Gouvernance des Données
Les personnes non spécialisées en données pensent souvent que la gouvernance de l'IA concerne uniquement l'éthique et l'évitement de biais involontaires, mais je crois que nos considérations pour adopter et faire confiance à l'IA doivent être plus larges et inclure la gouvernance des données sur lesquelles le modèle s'entraîne, ainsi que le modèle lui-même.
Je ne suis pas seul à penser cela; de plus en plus d'organisations reconnaissent déjà la gouvernance de l'IA comme un sous-ensemble de la gouvernance des données, et l'IA est régulièrement discutée lors des réunions des comités de gouvernance des données.
Mais vous n'avez pas à me croire sur parole. Lara Gureje, fondatrice de DatOculi et ancienne Vice-Présidente de la gouvernance des données d'entreprise au BNP Paribas Bank Group, propose cette perspective sur la qualité des données, la gouvernance des données, et l'IA :
"Au cœur de l'innovation en IA réside une quête incessante d'intelligence. Cependant, ce voyage vers l'intelligence dépend fortement de la qualité et de la gouvernance des données.
Les données gouvernées servent de matériau brut fondamental pour l'optimisation des modèles d'IA et de machine learning (ML). Sans fondation solide, la confiance dans les modèles diminue, rendant les analyses dénuées de sens.
Si les organisations se retrouvent à lutter avec les performances de leurs modèles d'IA et d'analyses, la question fondamentale surgit : "Quelle est la qualité des données alimentées dans ces modèles?" Il est temps que toute organisation cherchant à extraire des insights de ses données reconnaisse la nécessité impérative d'un environnement de données dirigé comme le facteur de succès critique.
La synergie entre l'IA/ML et la gouvernance des données est là où le vrai potentiel des actifs de données est débloqué. Faire de la gouvernance des données une partie intégrante de la culture organisationnelle devient la pierre angulaire pour stimuler l'innovation et extraire une valeur significative des données.
Un fait poignant émerge : le mariage de l'IA/ML et de la gouvernance des données représente le point idéal pour optimiser les actifs de données. C'est une relation symbiotique; on ne peut pas faire l'un sans l'autre.
Pourquoi cela compte?
Reconnaissez qu'il ne s'agit pas du volume de données mais plutôt de sa qualité et de sa fiabilité qui comptent lors de l'alimentation des modèles.
Gérez la santé des ensembles de données pour permettre de découvrir des insights optimaux et de la valeur dans les données.
Assurez-vous d'une utilisation efficace des ressources pour la curation et la collecte des données pour les modèles.
Voici comment optimiser les modèles d'IA/ML en suivant ces étapes pratiques pour intégrer la gouvernance des données dans vos initiatives :
Engagez tôt et lancez la gouvernance des données comme une condition préalable pour les projets d'IA/ML afin d'assurer l'alignement et l'efficacité.
Harmonisez et intégrez les données gouvernées et fiables de manière transparente dans les initiatives d'IA pour améliorer leur efficacité.
Évaluez de manière consistante la qualité des données alimentées dans les modèles et privilégiez les sources de données fiables.
Éduquez les citoyens des données et favorisez une mentalité culturelle de gestion responsable autour des actifs de données pour garantir des pratiques de gouvernance durables.
Mesurez en continu les sorties du modèle par rapport à la qualité des données d'entrée pour conduire à des améliorations.
Établissez des processus formalisés pour la certification et l'attestation des entrées et sorties de données afin de garantir la responsabilité et la fiabilité.
En conclusion, l'avenir de l'IA et du machine learning est prêt à changer et améliorer divers aspects de nos vies. Cependant, pour en débloquer le véritable potentiel, nous devons reconnaître que la qualité des résultats est intrinsèquement liée à la qualité des données d'entrée.
Des données gouvernées génèrent de meilleurs résultats, des données fiables produisent de meilleurs modèles, et de meilleurs modèles fournissent des prédictions d'IA supérieures.
La gouvernance des données occupe un rôle non négociable dans l'amélioration du paysage de l'IA pour le meilleur."
🎧 Vous pouvez écouter Lara et moi discuter de ce sujet en détail sur notre podcast ici.
La nature entrelacée de la qualité des données, de la gouvernance des données et de la gouvernance de l'IA signifie qu'il est vital d'embrasser les trois pour garantir une utilisation responsable et éthique de l'IA. Comme mon ami Tudor Borlea a dit :
"La Generative AI croît si rapidement que si vous ne vous en saisissez pas tôt avec la gouvernance, elle vous explosera au visage."
Alors, si votre organisation a déjà adopté ou est sur le point d'adopter GenAI, assurez-vous que vous pensez à la gouvernance de l'IA.
La gouvernance de l'IA est aussi vitale que les initiatives qui croissent rapidement en échelle et usage. Pour la gérer de manière responsable, nous devrions adopter la même approche que pour tout autre actif de notre organisation et le faire de manière intentionnelle et réfléchie.
Peut-être que l'emploi du mot "gouvernance" donne l'impression incorrecte que la gouvernance de l'IA concerne uniquement l'arrêt des gens de créer et d'utiliser des modèles d'IA, mais en réalité, cela se limite à nous assurer que nous faisons de notre mieux pour faire les choses correctement.
Les modèles d'IA prennent des décisions à grande vitesse et avec cette rapidité viennent de plus grands risques. La gouvernance est nécessaire pour garantir qu'il existe des principes et directives appropriés en place pour assurer le développement responsable de l'IA et l'utilisation de ses résultats.
Principes Fondamentaux pour Gouvernance de l'IA + Données
Il y a quelques mois, j'ai interviewé le Responsable de la Gouvernance des Données et de l'IA de Sony Europe, Sayantan Chaklader dans mon podcast, The Data Governance Podcast. Il était d'accord avec moi que les principes de gouvernance pour l'IA sont très similaires à ceux pour la gouvernance des données. Comme mentionné ci-dessus, il s'agit de faire la bonne chose de la bonne manière, que l'on parle de données ou d'IA.
Ce qui suit sont plusieurs principes que vous pourriez vouloir envisager pour votre approche de la gouvernance de l'IA.
Propriété: Assurez une propriété et une responsabilité appropriées pour les modèles d'IA et leurs résultats.
Transparence: Le but et la logique du modèle doivent être explicables et documentés.
Documentation: Sources des données comprises et documentées.
Pertinence: La qualité des données sources étant adaptée à son objectif.
Sécurité: Les données utilisées dans les modèles doivent être sécurisées de la même manière qu'elles le sont dans les autres systèmes de nos organisations.
Confidentialité: L'utilisation de données personnelles dans les modèles doit être conforme aux régulations de protection et de confidentialité des données.
Autonomisation: Une formation devrait être fournie à tous les utilisateurs de l'IA pour construire une compréhension de l'utilisation acceptable de l'IA. (D'expérience, cela fonctionne bien dans le cadre d'une formation à la culture de données.)
Cette liste se concentre sur le côté données de la gouvernance de l'IA, mais vous aurez également besoin de principes qui traitent de l'utilisation éthique, de la conformité réglementaire (comme certaines des dispositions de la EU AI Act qui entreront en vigueur plus tard cette année), et de la gestion des risques.
Alors que certains des principes ci-dessus concernent la sécurité des données et la protection des données, le reste des principes est identique, ou très similaire, à ceux d'un cadre de gouvernance des données. C'est pourquoi je crois fermement que vous n'avez pas besoin de créer un cadre séparé juste pour la gouvernance de l'IA.
Tout comme la qualité des données est couverte par votre cadre de gouvernance des données, vous devriez étendre sa portée pour couvrir l'IA. Cela est plus facile que de concevoir un autre cadre à partir de zéro, ce sera beaucoup plus simple pour vos parties prenantes commerciales de se l'approprier, et c'est beaucoup plus simple que d'avoir plusieurs cadres qui couvrent différentes choses.
Comment Commencer: Étapes vers la Gouvernance de l'IA
Alors, quelles mesures pouvez-vous prendre pour commencer votre voyage vers une gouvernance de l'IA responsable? Vous n'allez pas pouvoir concevoir et mettre en œuvre un programme du jour au lendemain, mais je commencerais le processus avec les étapes suivantes :
Favoriser une culture d'utilisation responsable de l'IA. Mettre en place une gouvernance formelle est susceptible de prendre du temps, alors commencez petit en incitant tout le monde à penser intentionnellement à l'utilisation de l'IA.
Ajouter la gouvernance de l'IA à votre agenda de gouvernance des données. Faites parler vos parties prenantes senior à ce sujet et comprendre son importance.
Créer et délivrer une formation à la culture de données qui inclut une sensibilisation à l'IA. Elle doit couvrir ce qu'ils peuvent et ne peuvent pas faire avec GenAI. Trop d'organisations déploient des outils comme Microsoft Co-Pilot sans aucune orientation pour le personnel sur ce qu'il devrait et, surtout, ne devrait pas être utilisé.
Évaluer l'utilisation actuelle de l'IA par votre organisation et les risques de son utilisation. Est-ce que cela correspond à l'appétit pour le risque actuel de votre organisation?
Développer votre politique de gouvernance de l'IA. Déterminez ce que vous voulez atteindre avec la gouvernance de l'IA, par exemple assurer une utilisation éthique, une conformité avec les réglementations, promouvoir la transparence, et se prémunir contre les biais.
Coordonnez votre approche de gouvernance de l'IA avec votre approche et cadre de gouvernance des données pour s'assurer que la qualité des données, la gouvernance des données et la gouvernance de l'IA sont entièrement alignées. Dans la mesure du possible, élargissez la portée de votre équipe et de vos processus de gouvernance des données existants pour inclure l'IA.
Former ou ajouter une expertise en IA à votre équipe de gouvernance des données.
Votre organisation est-elle prête à embrasser l'IA?
Reconnaissons-le : GenAI devient rapidement partie intégrante des opérations quotidiennes dans une grande et diverse collection d'industries. Les possibilités associées à l'adoption de GenAI sont très excitantes, à condition qu'elle soit embrassée de la bonne manière.
Dans une enquête récente sur la gouvernance des données que j'ai menée avec Baringa Partners, nous avons posé aux participants quelques questions sur l'IA et avons été surpris que seulement un peu plus de la moitié des répondants ait pris en considération l'impact de l'adoption de l'IA par leur organisation sur leur approche de gouvernance des données. Malgré ce nombre inférieur aux attentes, de nombreux répondants ont ajouté des commentaires pour souligner qu'ils estimaient que les activités d'IA et de gouvernance des données doivent être alignées et intégrées, tandis que certains ont exprimé des préoccupations que la qualité de leurs données n'était pas actuellement suffisante pour soutenir des initiatives d'IA.
L'enquête a également demandé des avis sur la capacité des équipes à gérer la qualité des données, et d'autres activités de gestion des données, sans IA. Plus de 70% pensaient qu'elles le pouvaient, et bien que jusqu'à récemment il y ait eu peu d'options pour utiliser l'IA dans ces activités, je pense qu'il est important de chercher des opportunités pour utiliser l'IA pour accélérer ces activités. Mais je reviendrai là-dessus dans mon prochain blog.
Dans un esprit similaire, il est intéressant de noter que Soda, une entreprise dont le logiciel est à la pointe de la qualité des données avec GenAI, a récemment mené un sondage sur LinkedIn pour voir si les gens pensaient que GenAI va perturber le workflow de la qualité des données, et les résultats ont montré des avis quelque peu partagés et finalement indécis. Il semble que ce soit une question de "attendre pour voir!"
C'est une période passionnante et GenAI va certainement impacter nos activités de qualité des données, donc nous devons nous assurer d'être prêts pour cela. Pour vous aider à démarrer, utilisez cette liste de vérification pour déterminer si les données de votre organisation sont prêtes à embrasser l'IA.
Liste de Vérification : Vos données sont-elles prêtes pour l'IA?
[ ] Avez-vous déjà mis en place un cadre de gouvernance des données avec des rôles, responsabilités, et processus documentés?
[ ] La gouvernance des données est-elle intégrée dans vos processus de projet et de gestion du changement?
[ ] Avez-vous un processus pour identifier et classer les données les plus importantes?
[ ] Utilisez-vous un catalogue de données?
[ ] Avez-vous des processus pour surveiller la qualité des données importantes?
[ ] Avez-vous des processus en place pour traiter les données de mauvaise qualité et les problèmes de données?
[ ] Avez-vous quelque chose en place qui offre une observabilité des données pour vous aider à surveiller la fiabilité des données?
[ ] Avez-vous un niveau raisonnable de culture de données à travers l'organisation?
Si vous avez répondu "non" à l'une de ces questions, il est temps d'agir.
Agissez!
Découvrez la plateforme de qualité des données de Soda pour préparer vos données à l'IA.
Bonne chance!
À propos de l'Auteur
En collaboration avec Soda, Nicola Askham, connue comme The Data Governance Coach, a rédigé une série complète en trois parties qui aborde des sujets critiques incluant la gouvernance des données, l'IA et la qualité des données.
Nicola se spécialise dans l'aide aux organisations pour améliorer leurs pratiques de gestion des données. Au cours des vingt dernières années, elle a aidé de nombreuses entreprises à réduire les coûts et les inefficacités grâce à ses initiatives de coaching, de conseil et de formation dédiées.
Sans aucun doute, l'ingestion de données de haute qualité et bien gouvernées améliore la précision des modèles d'IA. Avoir une bonne qualité de données est fondamental pour entraîner les modèles d'IA et obtenir les résultats souhaités.
Après tout, comment pouvez-vous faire confiance aux données que les modèles GenAI créent si les données sous-jacentes sont de mauvaise qualité?
Que ce soit générative ou pas, l'IA ne peut pas fournir les bonnes réponses ni générer de nouvelles perspectives utiles si la qualité des données sous-jacentes est médiocre. L'adage ancien reste vrai : "ordures à l'entrée, ordures à la sortie".
À l'inverse, utiliser des données de bonne qualité assure la confiance humaine dans les modèles d'IA et leurs résultats; ainsi, avoir des données de haute qualité est la fondation pour que les organisations développent et utilisent l'IA en toute confiance.
Dans cet article, nous explorons comment la gouvernance et la qualité se croisent dans l'IA, partageons les principes des praticiens et vous donnons une liste de contrôle pour garantir que vous êtes prêt pour une IA fiable.
Quelle est la différence entre l'IA et GenAI?
L'enthousiasme pour l'intelligence artificielle (IA), et la Generative AI (GenAI) en particulier, croît de manière exponentielle en ce moment. Beaucoup de gens ne comprennent pas la différence entre elles, alors avant d'explorer le rôle de la qualité des données dans l'IA, clarifions ce point. Il semble juste de demander à ChatGPT d'expliquer la différence :
L'IA est un terme large qui couvre tous les aspects des machines émule l'intelligence humaine, tandis que Generative AI se réfère spécifiquement à la branche de l'IA qui se concentre sur la création de nouveaux résultats originaux qui ressemblent aux données d'entraînement sans les reproduire. Cette distinction met en évidence la polyvalence des technologies d'IA et leur potentiel à automatiser des tâches et à favoriser des initiatives créatives.
L'IA existe depuis de nombreuses années et GenAI n'est pas aussi nouvelle que vous pourriez le penser, mais le traitement du langage naturel qui "crée des résultats nouveaux et originaux qui ressemblent aux données d'entraînement" l'a rendue accessible à multitude de personnes et elle a connu une adoption rapide. C'est une époque passionnante avec de nombreuses possibilités de la manière dont nous pouvons utiliser GenAI, entre autres, pour analyser nos données de manière plus rapide et plus facile que jamais.
Ça semble être une bonne chose, mais j'ai quelques préoccupations concernant la vitesse à laquelle elle est adoptée. GenAI est toujours plus excitante que la qualité des données, mais les résultats de l'IA ne sont bons que si le modèle et les données qu'il utilise sont bons.
Pourquoi la Qualité des Données est fondamentale pour l'IA
Dans le résumé ci-dessus, il est clair que l'IA utilise des données d'entraînement pour traiter et préparer des réponses aux entrées. Si ces données d'entraînement ne sont pas de bonne qualité ou même de très mauvaise qualité, GenAI arrive à de mauvaises conclusions, indépendamment de la qualité du modèle.
Les outils GenAI ne sont bons que si les données qu'ils consomment le sont. Par exemple, ChatGPT a été entraîné en utilisant tout ce qui se trouve sur Internet — quelqu'un croit-il que chaque fait sur Internet est correct? Même ChatGPT affiche ce message d'avertissement :
"ChatGPT peut faire des erreurs. Pensez à vérifier les informations importantes."
Les mauvaises données entraînent des résultats incorrects de l'IA, donc il suit que la bonne qualité des données est un élément fondamental pour l'adoption réussie de l'IA. Mais ce n'est pas seulement la qualité des données qui est nécessaire pour réussir avec l'IA, la gouvernance des données est aussi fondamentale.
Le rôle de la Gouvernance des Données dans l'IA
Dans mon dernier article, j'ai discuté de la relation entre la qualité des données et la gouvernance des données. Si il est essentiel qu'une IA saine s'entraîne sur des données de haute qualité et fiables, il suit que la gouvernance des données est aussi cruciale pour soutenir la qualité de ces données.
La gouvernance des données nous aide traditionnellement à comprendre ce que nous possédons, mais son rôle est maintenant plus large et soutient l'utilisation responsable de l'IA. Avec l'IA, nous devons aller un pas plus loin et comprendre ce que nous devrions utiliser ces données pour.
La gouvernance des données joue un rôle crucial dans l'IA en établissant des politiques et procédures claires pour la qualité des données, ce qui est essentiel pour entraîner des modèles d'IA fiables et éthiques.
Elle soutient le succès de l'IA en favorisant la confiance et la transparence dans les applications d'IA parmi les utilisateurs et les parties prenantes. Nous devons avoir confiance que l'IA fera ce qu'il faut et nous donnera les bonnes réponses. Nous devons nous assurer de développer et utiliser correctement GenAI.
Qu'est-ce que la Gouvernance de l'IA?
Il est très clair qu'il existe un interconnexion entre la qualité des données, la gouvernance des données, et l'IA. Ce chevauchement est appelé gouvernance de l'IA.

De la même manière que la gouvernance des données concerne bien plus que les données, la gouvernance de l'IA est bien plus large que juste les modèles d'IA. Sol Rashidi explique bien cela dans son livre, Your AI Survival Guide, lorsqu'elle dit:
"Peu importe votre rôle ou vos raisons, sachez que 70% du succès de votre déploiement d'IA n'a rien à voir avec la technologie. En réalité, la technologie est la partie la plus facile du cycle de vie, la plupart du travail concerne le capital humain et les relations, s'aligner sur les objectifs, surmonter les peurs, choisir la bonne stratégie, le bon cas d'utilisation, et trouver l'ambition."
La gouvernance de l'IA concerne la gestion de l'utilisation éthique, des risques, et des principes associés à l'IA, ce qui inclut nécessairement la gestion de la qualité et de la gouvernance des données sous-jacentes, comme illustré dans le schéma ci-dessus.
Dépendance de l'IA à la Qualité et à la Gouvernance des Données
Les personnes non spécialisées en données pensent souvent que la gouvernance de l'IA concerne uniquement l'éthique et l'évitement de biais involontaires, mais je crois que nos considérations pour adopter et faire confiance à l'IA doivent être plus larges et inclure la gouvernance des données sur lesquelles le modèle s'entraîne, ainsi que le modèle lui-même.
Je ne suis pas seul à penser cela; de plus en plus d'organisations reconnaissent déjà la gouvernance de l'IA comme un sous-ensemble de la gouvernance des données, et l'IA est régulièrement discutée lors des réunions des comités de gouvernance des données.
Mais vous n'avez pas à me croire sur parole. Lara Gureje, fondatrice de DatOculi et ancienne Vice-Présidente de la gouvernance des données d'entreprise au BNP Paribas Bank Group, propose cette perspective sur la qualité des données, la gouvernance des données, et l'IA :
"Au cœur de l'innovation en IA réside une quête incessante d'intelligence. Cependant, ce voyage vers l'intelligence dépend fortement de la qualité et de la gouvernance des données.
Les données gouvernées servent de matériau brut fondamental pour l'optimisation des modèles d'IA et de machine learning (ML). Sans fondation solide, la confiance dans les modèles diminue, rendant les analyses dénuées de sens.
Si les organisations se retrouvent à lutter avec les performances de leurs modèles d'IA et d'analyses, la question fondamentale surgit : "Quelle est la qualité des données alimentées dans ces modèles?" Il est temps que toute organisation cherchant à extraire des insights de ses données reconnaisse la nécessité impérative d'un environnement de données dirigé comme le facteur de succès critique.
La synergie entre l'IA/ML et la gouvernance des données est là où le vrai potentiel des actifs de données est débloqué. Faire de la gouvernance des données une partie intégrante de la culture organisationnelle devient la pierre angulaire pour stimuler l'innovation et extraire une valeur significative des données.
Un fait poignant émerge : le mariage de l'IA/ML et de la gouvernance des données représente le point idéal pour optimiser les actifs de données. C'est une relation symbiotique; on ne peut pas faire l'un sans l'autre.
Pourquoi cela compte?
Reconnaissez qu'il ne s'agit pas du volume de données mais plutôt de sa qualité et de sa fiabilité qui comptent lors de l'alimentation des modèles.
Gérez la santé des ensembles de données pour permettre de découvrir des insights optimaux et de la valeur dans les données.
Assurez-vous d'une utilisation efficace des ressources pour la curation et la collecte des données pour les modèles.
Voici comment optimiser les modèles d'IA/ML en suivant ces étapes pratiques pour intégrer la gouvernance des données dans vos initiatives :
Engagez tôt et lancez la gouvernance des données comme une condition préalable pour les projets d'IA/ML afin d'assurer l'alignement et l'efficacité.
Harmonisez et intégrez les données gouvernées et fiables de manière transparente dans les initiatives d'IA pour améliorer leur efficacité.
Évaluez de manière consistante la qualité des données alimentées dans les modèles et privilégiez les sources de données fiables.
Éduquez les citoyens des données et favorisez une mentalité culturelle de gestion responsable autour des actifs de données pour garantir des pratiques de gouvernance durables.
Mesurez en continu les sorties du modèle par rapport à la qualité des données d'entrée pour conduire à des améliorations.
Établissez des processus formalisés pour la certification et l'attestation des entrées et sorties de données afin de garantir la responsabilité et la fiabilité.
En conclusion, l'avenir de l'IA et du machine learning est prêt à changer et améliorer divers aspects de nos vies. Cependant, pour en débloquer le véritable potentiel, nous devons reconnaître que la qualité des résultats est intrinsèquement liée à la qualité des données d'entrée.
Des données gouvernées génèrent de meilleurs résultats, des données fiables produisent de meilleurs modèles, et de meilleurs modèles fournissent des prédictions d'IA supérieures.
La gouvernance des données occupe un rôle non négociable dans l'amélioration du paysage de l'IA pour le meilleur."
🎧 Vous pouvez écouter Lara et moi discuter de ce sujet en détail sur notre podcast ici.
La nature entrelacée de la qualité des données, de la gouvernance des données et de la gouvernance de l'IA signifie qu'il est vital d'embrasser les trois pour garantir une utilisation responsable et éthique de l'IA. Comme mon ami Tudor Borlea a dit :
"La Generative AI croît si rapidement que si vous ne vous en saisissez pas tôt avec la gouvernance, elle vous explosera au visage."
Alors, si votre organisation a déjà adopté ou est sur le point d'adopter GenAI, assurez-vous que vous pensez à la gouvernance de l'IA.
La gouvernance de l'IA est aussi vitale que les initiatives qui croissent rapidement en échelle et usage. Pour la gérer de manière responsable, nous devrions adopter la même approche que pour tout autre actif de notre organisation et le faire de manière intentionnelle et réfléchie.
Peut-être que l'emploi du mot "gouvernance" donne l'impression incorrecte que la gouvernance de l'IA concerne uniquement l'arrêt des gens de créer et d'utiliser des modèles d'IA, mais en réalité, cela se limite à nous assurer que nous faisons de notre mieux pour faire les choses correctement.
Les modèles d'IA prennent des décisions à grande vitesse et avec cette rapidité viennent de plus grands risques. La gouvernance est nécessaire pour garantir qu'il existe des principes et directives appropriés en place pour assurer le développement responsable de l'IA et l'utilisation de ses résultats.
Principes Fondamentaux pour Gouvernance de l'IA + Données
Il y a quelques mois, j'ai interviewé le Responsable de la Gouvernance des Données et de l'IA de Sony Europe, Sayantan Chaklader dans mon podcast, The Data Governance Podcast. Il était d'accord avec moi que les principes de gouvernance pour l'IA sont très similaires à ceux pour la gouvernance des données. Comme mentionné ci-dessus, il s'agit de faire la bonne chose de la bonne manière, que l'on parle de données ou d'IA.
Ce qui suit sont plusieurs principes que vous pourriez vouloir envisager pour votre approche de la gouvernance de l'IA.
Propriété: Assurez une propriété et une responsabilité appropriées pour les modèles d'IA et leurs résultats.
Transparence: Le but et la logique du modèle doivent être explicables et documentés.
Documentation: Sources des données comprises et documentées.
Pertinence: La qualité des données sources étant adaptée à son objectif.
Sécurité: Les données utilisées dans les modèles doivent être sécurisées de la même manière qu'elles le sont dans les autres systèmes de nos organisations.
Confidentialité: L'utilisation de données personnelles dans les modèles doit être conforme aux régulations de protection et de confidentialité des données.
Autonomisation: Une formation devrait être fournie à tous les utilisateurs de l'IA pour construire une compréhension de l'utilisation acceptable de l'IA. (D'expérience, cela fonctionne bien dans le cadre d'une formation à la culture de données.)
Cette liste se concentre sur le côté données de la gouvernance de l'IA, mais vous aurez également besoin de principes qui traitent de l'utilisation éthique, de la conformité réglementaire (comme certaines des dispositions de la EU AI Act qui entreront en vigueur plus tard cette année), et de la gestion des risques.
Alors que certains des principes ci-dessus concernent la sécurité des données et la protection des données, le reste des principes est identique, ou très similaire, à ceux d'un cadre de gouvernance des données. C'est pourquoi je crois fermement que vous n'avez pas besoin de créer un cadre séparé juste pour la gouvernance de l'IA.
Tout comme la qualité des données est couverte par votre cadre de gouvernance des données, vous devriez étendre sa portée pour couvrir l'IA. Cela est plus facile que de concevoir un autre cadre à partir de zéro, ce sera beaucoup plus simple pour vos parties prenantes commerciales de se l'approprier, et c'est beaucoup plus simple que d'avoir plusieurs cadres qui couvrent différentes choses.
Comment Commencer: Étapes vers la Gouvernance de l'IA
Alors, quelles mesures pouvez-vous prendre pour commencer votre voyage vers une gouvernance de l'IA responsable? Vous n'allez pas pouvoir concevoir et mettre en œuvre un programme du jour au lendemain, mais je commencerais le processus avec les étapes suivantes :
Favoriser une culture d'utilisation responsable de l'IA. Mettre en place une gouvernance formelle est susceptible de prendre du temps, alors commencez petit en incitant tout le monde à penser intentionnellement à l'utilisation de l'IA.
Ajouter la gouvernance de l'IA à votre agenda de gouvernance des données. Faites parler vos parties prenantes senior à ce sujet et comprendre son importance.
Créer et délivrer une formation à la culture de données qui inclut une sensibilisation à l'IA. Elle doit couvrir ce qu'ils peuvent et ne peuvent pas faire avec GenAI. Trop d'organisations déploient des outils comme Microsoft Co-Pilot sans aucune orientation pour le personnel sur ce qu'il devrait et, surtout, ne devrait pas être utilisé.
Évaluer l'utilisation actuelle de l'IA par votre organisation et les risques de son utilisation. Est-ce que cela correspond à l'appétit pour le risque actuel de votre organisation?
Développer votre politique de gouvernance de l'IA. Déterminez ce que vous voulez atteindre avec la gouvernance de l'IA, par exemple assurer une utilisation éthique, une conformité avec les réglementations, promouvoir la transparence, et se prémunir contre les biais.
Coordonnez votre approche de gouvernance de l'IA avec votre approche et cadre de gouvernance des données pour s'assurer que la qualité des données, la gouvernance des données et la gouvernance de l'IA sont entièrement alignées. Dans la mesure du possible, élargissez la portée de votre équipe et de vos processus de gouvernance des données existants pour inclure l'IA.
Former ou ajouter une expertise en IA à votre équipe de gouvernance des données.
Votre organisation est-elle prête à embrasser l'IA?
Reconnaissons-le : GenAI devient rapidement partie intégrante des opérations quotidiennes dans une grande et diverse collection d'industries. Les possibilités associées à l'adoption de GenAI sont très excitantes, à condition qu'elle soit embrassée de la bonne manière.
Dans une enquête récente sur la gouvernance des données que j'ai menée avec Baringa Partners, nous avons posé aux participants quelques questions sur l'IA et avons été surpris que seulement un peu plus de la moitié des répondants ait pris en considération l'impact de l'adoption de l'IA par leur organisation sur leur approche de gouvernance des données. Malgré ce nombre inférieur aux attentes, de nombreux répondants ont ajouté des commentaires pour souligner qu'ils estimaient que les activités d'IA et de gouvernance des données doivent être alignées et intégrées, tandis que certains ont exprimé des préoccupations que la qualité de leurs données n'était pas actuellement suffisante pour soutenir des initiatives d'IA.
L'enquête a également demandé des avis sur la capacité des équipes à gérer la qualité des données, et d'autres activités de gestion des données, sans IA. Plus de 70% pensaient qu'elles le pouvaient, et bien que jusqu'à récemment il y ait eu peu d'options pour utiliser l'IA dans ces activités, je pense qu'il est important de chercher des opportunités pour utiliser l'IA pour accélérer ces activités. Mais je reviendrai là-dessus dans mon prochain blog.
Dans un esprit similaire, il est intéressant de noter que Soda, une entreprise dont le logiciel est à la pointe de la qualité des données avec GenAI, a récemment mené un sondage sur LinkedIn pour voir si les gens pensaient que GenAI va perturber le workflow de la qualité des données, et les résultats ont montré des avis quelque peu partagés et finalement indécis. Il semble que ce soit une question de "attendre pour voir!"
C'est une période passionnante et GenAI va certainement impacter nos activités de qualité des données, donc nous devons nous assurer d'être prêts pour cela. Pour vous aider à démarrer, utilisez cette liste de vérification pour déterminer si les données de votre organisation sont prêtes à embrasser l'IA.
Liste de Vérification : Vos données sont-elles prêtes pour l'IA?
[ ] Avez-vous déjà mis en place un cadre de gouvernance des données avec des rôles, responsabilités, et processus documentés?
[ ] La gouvernance des données est-elle intégrée dans vos processus de projet et de gestion du changement?
[ ] Avez-vous un processus pour identifier et classer les données les plus importantes?
[ ] Utilisez-vous un catalogue de données?
[ ] Avez-vous des processus pour surveiller la qualité des données importantes?
[ ] Avez-vous des processus en place pour traiter les données de mauvaise qualité et les problèmes de données?
[ ] Avez-vous quelque chose en place qui offre une observabilité des données pour vous aider à surveiller la fiabilité des données?
[ ] Avez-vous un niveau raisonnable de culture de données à travers l'organisation?
Si vous avez répondu "non" à l'une de ces questions, il est temps d'agir.
Agissez!
Découvrez la plateforme de qualité des données de Soda pour préparer vos données à l'IA.
Bonne chance!
À propos de l'Auteur
En collaboration avec Soda, Nicola Askham, connue comme The Data Governance Coach, a rédigé une série complète en trois parties qui aborde des sujets critiques incluant la gouvernance des données, l'IA et la qualité des données.
Nicola se spécialise dans l'aide aux organisations pour améliorer leurs pratiques de gestion des données. Au cours des vingt dernières années, elle a aidé de nombreuses entreprises à réduire les coûts et les inefficacités grâce à ses initiatives de coaching, de conseil et de formation dédiées.
Trusted by the world’s leading enterprises
Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.
At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava
Director of Data Governance, Quality and MLOps
Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake
Director of Product-Data Platform
Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta
Data Engineering Manager
Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie
Head of Data Engineering
4,4 sur 5
Commencez à faire confiance à vos données. Aujourd'hui.
Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.
Adopté par




Trusted by the world’s leading enterprises
Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.
At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava
Director of Data Governance, Quality and MLOps
Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake
Director of Product-Data Platform
Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta
Data Engineering Manager
Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie
Head of Data Engineering
4,4 sur 5
Commencez à faire confiance à vos données. Aujourd'hui.
Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.
Adopté par
Solutions




Trusted by the world’s leading enterprises
Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.
At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava
Director of Data Governance, Quality and MLOps
Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake
Director of Product-Data Platform
Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta
Data Engineering Manager
Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie
Head of Data Engineering
4,4 sur 5
Commencez à faire confiance à vos données. Aujourd'hui.
Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.
Adopté par
Solutions



