Article invité : Construire l'équipe de rêve en gestion des données

Article invité : Construire l'équipe de rêve en gestion des données

26 oct. 2021

Jesse Anderson

Jesse Anderson

Directeur général chez Big Data Institute

Directeur général chez Big Data Institute

Table des matières

Les organisations opèrent un changement fondamental dans leur façon de penser les données, à mesure que la chaîne de valeur des données modernes évolue. Et en même temps, elles doivent modifier la façon dont elles construisent des équipes autour des données.

En partenariat avec Soda, une entreprise de logiciels née en Belgique qui s'impose comme la plateforme d'observabilité des données pour tester, surveiller et gérer la qualité des données, nous avons lancé une série pour explorer le « Data Dream Team ».

Nous pensons que le sujet de l'équipe de données est vraiment important. Non seulement parce que nous croyons que les données sont un sport d'équipe, mais aussi parce que le passage radical à la mise au premier plan des données dans tant d'organisations nécessite une nouvelle approche pour aligner la structure et l'organisation autour des données. Nouveaux rôles, responsabilités redéfinies, briser les silos et forger de nouveaux canaux de collaboration. Nous allons le déconstruire et le reconstruire pour comprendre ce que signifie « bien ».

Pour commencer notre série Data Dream Team, nous avons choisi le football comme notre analogie, pour plusieurs bonnes raisons (dont beaucoup que vous ne devinerez sûrement pas). La première raison est que la Belgique est actuellement classée par la FIFA (Fédération Internationale de Football Association) comme la meilleure équipe de football du monde. La deuxième raison est que 2021 a été l'été du football en Europe, avec l'UEFA Euro 2020 qui s'est déroulé en juin et juillet. Bien que malheureusement la Belgique n'ait pas remporté le championnat (félicitations à l'Italie), l'importance du football sur ce continent était indéniable. La troisième raison fut l'inspiration tirée du livre de Michael Cox Zonal Marking, dans lequel il explore la création du football européen moderne défini par les formations d'équipe, les stratégies de jeu et la culture.

Analogie complète et lien avec la Belgique justifié.

Les trois équipes pour les données

Dans mon livre, Data Teams, je parle souvent de l'importance d'obtenir le bon équilibre dans une équipe, entre les personnes et les compétences, l'expérience et l'éducation - et ensuite faire en sorte que tout le monde collabore. De mes recherches sur les équipes qui réussissent et celles qui échouent, j'en ai conclu que pour gérer les données comme un produit, vous avez besoin de trois équipes principales, chacune ayant un rôle très spécifique. Chaque équipe représente des compétences, des forces et des approches différentes nécessaires pour créer de la valeur à partir des données.

Laissez-moi vous présenter brièvement chaque équipe. L'équipe d'ingénierie des données crée les produits de données et s'assure qu'ils sont livrés via des pipelines de données fiables. L'équipe scientifique des données utilise ces produits de données et les combine avec des analyses avancées pour créer une nouvelle valeur commerciale. L'équipe des opérations veille au bon fonctionnement afin que les consommateurs de données ne dépendent pas de quelque chose d'incertain.

Alors par où commencer et où investir en premier ? Il est important de comprendre d'abord les compétences et les forces que vous avez actuellement dans votre équipe et d'identifier les lacunes d'expérience.

Plongeons donc dedans.

L'équipe des opérations

Au football, c'est la défense. L'équipe actuellement classée numéro un au monde (Belgique) est remplie de créativité offensive et a formé l'une des lignes arrière les plus dignes de confiance et fiables du football mondial depuis près d'une décennie.

L'équipe des opérations est chargée de mettre en production des logiciels du commerce et des logiciels développés en interne et de s'assurer qu'ils fonctionnent correctement. Les compétences requises dans une équipe d'opérations sont variées: matériel, logiciels/systèmes d'exploitation, systèmes distribués, dépannage, sécurité, structures et formats de données, scripting/programmation, meilleures pratiques d'opérationnalisation, surveillance et instrumentation, et récupération après sinistre.

L'équipe des opérations doit être familière avec les données utilisées. Ces données comprennent des informations comme la quantité ou la taille attendue des données elles-mêmes, le type de données envoyées et le format correct des données. Ces informations aident l'équipe à planifier l'allocation des ressources.

L'équipe d'ingénierie des données

Sur le terrain de football, il s'agit du milieu de terrain. Pour la Belgique, c'est la zone la plus forte de l'équipe car ils peuvent compter sur un éventail de talents de soutien, tous comprenant le rôle qu'ils doivent jouer pour soutenir l'équipe. Cela les distingue - l'équilibre des compétences utilisées pour neutraliser un adversaire ou monter une attaque est inégalé.

L'équipe d'ingénierie des données place les données au bon endroit et s'assure qu'elles sont utilisables. Une équipe d'ingénierie de données est responsable de la création de produits de données et de l'architecture pour construire des produits de données, des pipelines de données. L'équipe d'ingénierie des données doit choisir les bonnes technologies pour les données et les cas d'utilisation afin d'accomplir cette tâche.

Parce que l'écriture et le test de ce code font partie du travail de l'équipe d'ingénierie des données, un diplôme en ingénierie logicielle est fortement recommandé. Les ingénieurs de données sont chargés d'écrire le code qui exécute le cas d'utilisation sur le cadre de traitement de big data, et ils doivent être des programmeurs qualifiés. Les ingénieurs de données sont également responsables de l'intégration continue, des tests unitaires et des processus d'ingénierie. Ces besoins sont souvent mal compris et laissés pour compte dans les équipes. Les ingénieurs de données s'intéressent également aux données elles-mêmes. Certains iraient jusqu'à dire qu’ils ont une passion pour les données - et je suis d'accord.

L'équipe scientifique des données

Sur le terrain de football, ce sont les attaquants. Les attaquants belges opèrent à l'extrémité la plus avancée, en utilisant les fondations solides bâties par le reste de l'équipe pour faire la chose la plus importante au football : marquer des buts.

L'objectif de l'équipe scientifique des données est de créer des analyses avancées. À l'extrémité supérieure du spectre, celles-ci peuvent être générées par l'intelligence artificielle (IA), où l'apprentissage automatique (ML) est actuellement la technique la plus courante. À l'extrémité inférieure, ces analyses sont construites à partir de statistiques et mathématiques avancées. D'autres membres de l'équipe de données peuvent également connaître les statistiques et les mathématiques, mais pas au niveau sophistiqué requis pour la science des données.

Ainsi, un data scientist combine une formation en mathématiques et statistiques avancées avec des compétences en programmation, des connaissances de domaine, et des compétences en communication pour analyser les données, créer des modèles mathématiques appliqués, et présenter les résultats sous une forme utile pour l'organisation.

L'équipe scientifique des données ne devrait pas être sollicitée pour créer l'infrastructure de données ou les architectures logicielles qu'elle utilise pour créer les produits de données, faire des découvertes, entraîner les modèles ou déployer ces modèles. Ces tâches d'infrastructure relèvent davantage du domaine de l'équipe d'ingénierie des données. En outre, les data scientists sont des ressources rares qui ont beaucoup à faire en dehors de la création d'infrastructure. Ainsi, l'équipe scientifique des données devrait s'appuyer sur l'infrastructure de données et l'architecture logicielle de l'équipe d'ingénierie des données.

Le manager

Au football, le manager n'est pas sur le terrain. Vous pouvez le voir arpenter la ligne de touche en espérant que sa stratégie axée sur les données et sa formation porteront leurs fruits. Il est responsable des décisions globales. C'est son travail de s'assurer que les bonnes personnes sont aux bons postes et qu'aucune compétence ne manque.

Dans les équipes de données, ce manager exécutif varie selon les entreprises. Dans certaines entreprises, il y a deux ou trois cadres différents. Par exemple, la science des données pourrait relever d'un directeur financier tandis que l'ingénierie/des opérations relève du directeur technique. Avec deux cadres différents, viennent des objectifs différents qui peuvent se traduire par des défis pour aligner les équipes. Avec un seul cadre, comme un directeur analytique ou un directeur des données, il peut y avoir une bien meilleure harmonisation autour des objectifs et des responsabilités. C'est mon opinion et mon expérience que les équipes de données prospèrent sous un seul cadre, tout comme il n'y a qu'un seul manager dans l'équipe de football.

Conclusion

Maintenant que nous avons vu les différentes équipes et leurs équivalents footballistiques, nous pouvons mieux comprendre une équipe de données. Nous constatons en effet qu'aucune partie de l'équipe n'est plus importante que les autres. Que se passerait-il si une de nos parties était manquante?

D'après mes recherches, j'ai constaté que de nombreuses organisations manquent d'au moins une des trois équipes. Selon l'équipe qui manque, elles subissent soit toutes sortes de buts (pas d'opérations), ne peuvent pas déplacer le ballon pour marquer (pas d'ingénierie des données), ou ne peuvent pas marquer (pas de science des données). Peut-être que le problème le plus courant que j'ai observé est d'embaucher une équipe de données composée uniquement de data scientists et de se demander pourquoi ils ne peuvent pas marquer de buts.

Une équipe efficace doit couvrir à peu près toutes les compétences du domaine informatique, y compris quelques-unes qui sont relativement rares. Ainsi, non seulement il est essentiel d'assigner des rôles clairs aux équipes, mais une certaine différenciation au sein de chaque équipe est également nécessaire pour obtenir la gamme d'expertise requise. Cela dit, il y a un certain chevauchement entre les rôles des différentes équipes. D'où l'importance des compétences en communication pour compléter les fonctions. C'est seulement après un travail d'équipe intensif que nous pouvons marquer le but !

Dans le cadre du Data Dream Team, il y a une série de podcasts qui explorent la croissance et le développement de votre équipe et de leurs compétences - avec des invités tels que Paco Nathan, Jordan Morrow, Zhamak Dehgahni, Holden Karau, et Caroline Carruthers et Peter Jackson. Je vous encourage à rejoindre la conversation et à entendre comment les leaders et praticiens des données mettent leurs équipes de rêve en jeu.

Trusted by the world’s leading enterprises

Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.

At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava

Director of Data Governance, Quality and MLOps

Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake

Director of Product-Data Platform

Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta

Data Engineering Manager

Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie

Head of Data Engineering

4,4 sur 5

Commencez à faire confiance à vos données. Aujourd'hui.

Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.

Adopté par

Trusted by the world’s leading enterprises

Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.

At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava

Director of Data Governance, Quality and MLOps

Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake

Director of Product-Data Platform

Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta

Data Engineering Manager

Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie

Head of Data Engineering

4,4 sur 5

Commencez à faire confiance à vos données. Aujourd'hui.

Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.

Adopté par

Trusted by the world’s leading enterprises

Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.

At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava

Director of Data Governance, Quality and MLOps

Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake

Director of Product-Data Platform

Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta

Data Engineering Manager

Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie

Head of Data Engineering

4,4 sur 5

Commencez à faire confiance à vos données. Aujourd'hui.

Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.

Adopté par