Soda a acquis la startup de surveillance ML NannyML

Soda a acquis la startup de surveillance ML NannyML

9 juin 2025

Maarten Masschelein

Maarten Masschelein

Maarten Masschelein

PDG et Fondateur chez Soda

PDG et Fondateur chez Soda

PDG et Fondateur chez Soda

Table des matières

Aujourd'hui nous lançons la Semaine de Lancement Soda avec une annonce majeure : Soda a acquis NannyML.

Ensemble, nous construisons la plateforme de qualité des données la plus intelligente et contextuelle du marché. Une solution qui vous aide à prévenir les problèmes avant qu’ils ne deviennent des problèmes d'affaires, à détecter les anomalies qui comptent vraiment et à identifier les causes profondes à travers toute la pile, depuis l'ingestion de données jusqu'à la prise de décision automatisée.

Ce mouvement réunit deux équipes avec un objectif commun : aider les équipes de données et d'IA à livrer des systèmes fiables, de qualité de production, en lesquels elles peuvent avoir confiance, que ces systèmes alimentent des tableaux de bord, des modèles ou des agents autonomes.

Voyons ce que cela signifie, pourquoi nous le faisons et ce qui s'en vient.

Le fossé dans la qualité des données s'aggrave

Si vous avez travaillé sur des infrastructures de données ou d'IA, vous avez vécu cela :

  • Un pipeline laisse silencieusement tomber une colonne, pas d'échec de schéma, mais une métrique en aval s'aplatit.

  • Un tableau de bord montre soudainement une baisse de 30 % des revenus, et personne ne sait pourquoi.

  • Un modèle en production commence à dériver en raison de légers changements dans le comportement des utilisateurs.

  • Un agent se réentraîne ou réagit en se basant sur des données corrompues, et personne ne s'en aperçoit avant que des décisions soient prises.

La plupart des outils de qualité des données actuels ne peuvent pas gérer cela. Ils ont été conçus pour une autre ère de traitements par lot, de schémas statiques, de flux de données prévisibles. Ils signalent trop de bruit, manquent de contexte critique et montrent rarement l'impact en aval.

En même temps, les systèmes que nous construisons aujourd'hui sont plus dynamiques que jamais :

  • Agents

  • Décision basée sur LLM

  • Personnalisation en temps réel

  • Pipelines hybrides batch-streaming

  • Boucles de réentraînement continus

Dans ce monde, les vérifications traditionnelles et la détection d'anomalies ne suffisent plus. La qualité des données n'est plus seulement une question de correction, c'est une question de conséquence.

Pourquoi NannyML

NannyML a abordé l’un des problèmes les plus difficiles des systèmes d'IA modernes :

Comment surveillez-vous la performance des modèles en production, quand il n'y a pas encore de vérité terrain ?

Leur bibliothèque open-source a introduit la surveillance de performance basée sur l'estimation, la détection robuste des dérives, et l'alerting conçu pour des pipelines ML réels. Elle est devenue la boîte à outils incontournable pour les équipes exécutant des modèles où les étiquettes sont retardées, rares ou indisponibles.

Mais plus important encore, ils ont vu ce qui s'en venait :

Que les modèles ne faillissent pas en isolation. Ils échouent lorsque les pipelines de données se dégradent, quand le comportement des utilisateurs change, quand les hypothèses en amont sont rompues. Et ils croyaient que la seule façon de résoudre cela était de fermer la boucle entre la qualité des données et le comportement de l'IA.

Nous avons cru la même chose depuis le premier jour.

En réunissant nos équipes et nos plateformes, nous unifions ces couches. Offrir un produit qui peut surveiller l'ensemble de votre système, pas seulement des morceaux de celui-ci.

Ce que nous construisons ensemble

Avec l’équipe et la technologie de NannyML maintenant intégrées à Soda, voici ce que cela permet :

Détection plus intelligente au niveau du DQ

Les algorithmes de NannyML alimenteront un cœur plus intelligent dans les vérifications et l'observabilité de Soda. Réduire le bruit, faire émerger les vrais problèmes plus rapidement et s'adapter aux changements.

Alertes contextuelles à travers la pile

Suivez les anomalies à travers les systèmes : d'une dérive de colonne dans votre entrepôt, à un changement de prédiction dans votre modèle, à une modification de comportement dans vos agents.

Observabilité de bout en bout : des données à la décision

Surveillez le cycle de vie complet, pas seulement les tables ou les vérifications. Voyez comment les problèmes en amont se répercutent dans les systèmes en aval. Sachez ce qui a changé, pourquoi c'est important et ce qu'il faut corriger.

Infrastructure de qualité native à l'IA

Que vous exécutiez des analyses batch, des fonctionnalités en quasi temps réel, ou une orchestration LLM, nous construisons une infrastructure fondamentale qui maintient les données et le comportement alignés.

Et oui, le projet open-source de NannyML restera ouvert, maintenu et pleinement pris en charge. Nous ne le fermons pas. Nous l'élargissons.

Pourquoi maintenant

Parce que le coût des mauvaises données augmente, et rapidement.

Les systèmes que les données alimentent aujourd'hui sont plus cruciaux, plus rapides et plus difficiles à déboguer.

Si vos outils ne comprennent pas l'impact, ils n'aident pas. S'ils ne peuvent pas gérer l'émergence et la dérive, ils sont inutiles. Et s'ils ne sont pas conçus pour des environnements native-IA, ils sont déjà dépassés.

Nous ne sommes pas ici pour coller “IA” sur des vérifications héritées. Nous sommes ici pour rendre la qualité des données réellement intelligente :

  • Sensible à l'impact

  • Riche en contextes

  • Connecté au cycle de vie

  • Et prêt pour des systèmes qui apprennent, s'adaptent et agissent

Cette acquisition accélère cette mission.

Ce qui vient cette semaine

C'est le jour 1 de la Semaine de Lancement. Toute la semaine, nous annoncerons de nouvelles capacités et des lancements de produits qui montrent ce que signifie la qualité des données intelligente, axée sur l'IA, en pratique.

Voici un aperçu de ce qui s'en vient :

  • Les capacités de métriques les plus rapides et précises

  • Contrats de données collaboratifs

  • Un niveau gratuit pour toujours et une tarification transparente

Nous en sommes juste au début, et nous construisons rapidement.

Où aller ensuite

Regardez le webinaire d'annonce complet

Écoutez directement Maarten et Hakim à propos de ce qui change, et ce qui s'en vient.

Essayez Soda

Voyez comment notre plateforme évolue pour soutenir les équipes natives-IA. Pas de superflu, juste les signaux qui comptent.

Ceci est le prochain chapitre pour la qualité des données.

Plus intelligent. Plus rapide. Prêt pour l'IA.

Et conçu pour des équipes comme la vôtre.

Aujourd'hui nous lançons la Semaine de Lancement Soda avec une annonce majeure : Soda a acquis NannyML.

Ensemble, nous construisons la plateforme de qualité des données la plus intelligente et contextuelle du marché. Une solution qui vous aide à prévenir les problèmes avant qu’ils ne deviennent des problèmes d'affaires, à détecter les anomalies qui comptent vraiment et à identifier les causes profondes à travers toute la pile, depuis l'ingestion de données jusqu'à la prise de décision automatisée.

Ce mouvement réunit deux équipes avec un objectif commun : aider les équipes de données et d'IA à livrer des systèmes fiables, de qualité de production, en lesquels elles peuvent avoir confiance, que ces systèmes alimentent des tableaux de bord, des modèles ou des agents autonomes.

Voyons ce que cela signifie, pourquoi nous le faisons et ce qui s'en vient.

Le fossé dans la qualité des données s'aggrave

Si vous avez travaillé sur des infrastructures de données ou d'IA, vous avez vécu cela :

  • Un pipeline laisse silencieusement tomber une colonne, pas d'échec de schéma, mais une métrique en aval s'aplatit.

  • Un tableau de bord montre soudainement une baisse de 30 % des revenus, et personne ne sait pourquoi.

  • Un modèle en production commence à dériver en raison de légers changements dans le comportement des utilisateurs.

  • Un agent se réentraîne ou réagit en se basant sur des données corrompues, et personne ne s'en aperçoit avant que des décisions soient prises.

La plupart des outils de qualité des données actuels ne peuvent pas gérer cela. Ils ont été conçus pour une autre ère de traitements par lot, de schémas statiques, de flux de données prévisibles. Ils signalent trop de bruit, manquent de contexte critique et montrent rarement l'impact en aval.

En même temps, les systèmes que nous construisons aujourd'hui sont plus dynamiques que jamais :

  • Agents

  • Décision basée sur LLM

  • Personnalisation en temps réel

  • Pipelines hybrides batch-streaming

  • Boucles de réentraînement continus

Dans ce monde, les vérifications traditionnelles et la détection d'anomalies ne suffisent plus. La qualité des données n'est plus seulement une question de correction, c'est une question de conséquence.

Pourquoi NannyML

NannyML a abordé l’un des problèmes les plus difficiles des systèmes d'IA modernes :

Comment surveillez-vous la performance des modèles en production, quand il n'y a pas encore de vérité terrain ?

Leur bibliothèque open-source a introduit la surveillance de performance basée sur l'estimation, la détection robuste des dérives, et l'alerting conçu pour des pipelines ML réels. Elle est devenue la boîte à outils incontournable pour les équipes exécutant des modèles où les étiquettes sont retardées, rares ou indisponibles.

Mais plus important encore, ils ont vu ce qui s'en venait :

Que les modèles ne faillissent pas en isolation. Ils échouent lorsque les pipelines de données se dégradent, quand le comportement des utilisateurs change, quand les hypothèses en amont sont rompues. Et ils croyaient que la seule façon de résoudre cela était de fermer la boucle entre la qualité des données et le comportement de l'IA.

Nous avons cru la même chose depuis le premier jour.

En réunissant nos équipes et nos plateformes, nous unifions ces couches. Offrir un produit qui peut surveiller l'ensemble de votre système, pas seulement des morceaux de celui-ci.

Ce que nous construisons ensemble

Avec l’équipe et la technologie de NannyML maintenant intégrées à Soda, voici ce que cela permet :

Détection plus intelligente au niveau du DQ

Les algorithmes de NannyML alimenteront un cœur plus intelligent dans les vérifications et l'observabilité de Soda. Réduire le bruit, faire émerger les vrais problèmes plus rapidement et s'adapter aux changements.

Alertes contextuelles à travers la pile

Suivez les anomalies à travers les systèmes : d'une dérive de colonne dans votre entrepôt, à un changement de prédiction dans votre modèle, à une modification de comportement dans vos agents.

Observabilité de bout en bout : des données à la décision

Surveillez le cycle de vie complet, pas seulement les tables ou les vérifications. Voyez comment les problèmes en amont se répercutent dans les systèmes en aval. Sachez ce qui a changé, pourquoi c'est important et ce qu'il faut corriger.

Infrastructure de qualité native à l'IA

Que vous exécutiez des analyses batch, des fonctionnalités en quasi temps réel, ou une orchestration LLM, nous construisons une infrastructure fondamentale qui maintient les données et le comportement alignés.

Et oui, le projet open-source de NannyML restera ouvert, maintenu et pleinement pris en charge. Nous ne le fermons pas. Nous l'élargissons.

Pourquoi maintenant

Parce que le coût des mauvaises données augmente, et rapidement.

Les systèmes que les données alimentent aujourd'hui sont plus cruciaux, plus rapides et plus difficiles à déboguer.

Si vos outils ne comprennent pas l'impact, ils n'aident pas. S'ils ne peuvent pas gérer l'émergence et la dérive, ils sont inutiles. Et s'ils ne sont pas conçus pour des environnements native-IA, ils sont déjà dépassés.

Nous ne sommes pas ici pour coller “IA” sur des vérifications héritées. Nous sommes ici pour rendre la qualité des données réellement intelligente :

  • Sensible à l'impact

  • Riche en contextes

  • Connecté au cycle de vie

  • Et prêt pour des systèmes qui apprennent, s'adaptent et agissent

Cette acquisition accélère cette mission.

Ce qui vient cette semaine

C'est le jour 1 de la Semaine de Lancement. Toute la semaine, nous annoncerons de nouvelles capacités et des lancements de produits qui montrent ce que signifie la qualité des données intelligente, axée sur l'IA, en pratique.

Voici un aperçu de ce qui s'en vient :

  • Les capacités de métriques les plus rapides et précises

  • Contrats de données collaboratifs

  • Un niveau gratuit pour toujours et une tarification transparente

Nous en sommes juste au début, et nous construisons rapidement.

Où aller ensuite

Regardez le webinaire d'annonce complet

Écoutez directement Maarten et Hakim à propos de ce qui change, et ce qui s'en vient.

Essayez Soda

Voyez comment notre plateforme évolue pour soutenir les équipes natives-IA. Pas de superflu, juste les signaux qui comptent.

Ceci est le prochain chapitre pour la qualité des données.

Plus intelligent. Plus rapide. Prêt pour l'IA.

Et conçu pour des équipes comme la vôtre.

Aujourd'hui nous lançons la Semaine de Lancement Soda avec une annonce majeure : Soda a acquis NannyML.

Ensemble, nous construisons la plateforme de qualité des données la plus intelligente et contextuelle du marché. Une solution qui vous aide à prévenir les problèmes avant qu’ils ne deviennent des problèmes d'affaires, à détecter les anomalies qui comptent vraiment et à identifier les causes profondes à travers toute la pile, depuis l'ingestion de données jusqu'à la prise de décision automatisée.

Ce mouvement réunit deux équipes avec un objectif commun : aider les équipes de données et d'IA à livrer des systèmes fiables, de qualité de production, en lesquels elles peuvent avoir confiance, que ces systèmes alimentent des tableaux de bord, des modèles ou des agents autonomes.

Voyons ce que cela signifie, pourquoi nous le faisons et ce qui s'en vient.

Le fossé dans la qualité des données s'aggrave

Si vous avez travaillé sur des infrastructures de données ou d'IA, vous avez vécu cela :

  • Un pipeline laisse silencieusement tomber une colonne, pas d'échec de schéma, mais une métrique en aval s'aplatit.

  • Un tableau de bord montre soudainement une baisse de 30 % des revenus, et personne ne sait pourquoi.

  • Un modèle en production commence à dériver en raison de légers changements dans le comportement des utilisateurs.

  • Un agent se réentraîne ou réagit en se basant sur des données corrompues, et personne ne s'en aperçoit avant que des décisions soient prises.

La plupart des outils de qualité des données actuels ne peuvent pas gérer cela. Ils ont été conçus pour une autre ère de traitements par lot, de schémas statiques, de flux de données prévisibles. Ils signalent trop de bruit, manquent de contexte critique et montrent rarement l'impact en aval.

En même temps, les systèmes que nous construisons aujourd'hui sont plus dynamiques que jamais :

  • Agents

  • Décision basée sur LLM

  • Personnalisation en temps réel

  • Pipelines hybrides batch-streaming

  • Boucles de réentraînement continus

Dans ce monde, les vérifications traditionnelles et la détection d'anomalies ne suffisent plus. La qualité des données n'est plus seulement une question de correction, c'est une question de conséquence.

Pourquoi NannyML

NannyML a abordé l’un des problèmes les plus difficiles des systèmes d'IA modernes :

Comment surveillez-vous la performance des modèles en production, quand il n'y a pas encore de vérité terrain ?

Leur bibliothèque open-source a introduit la surveillance de performance basée sur l'estimation, la détection robuste des dérives, et l'alerting conçu pour des pipelines ML réels. Elle est devenue la boîte à outils incontournable pour les équipes exécutant des modèles où les étiquettes sont retardées, rares ou indisponibles.

Mais plus important encore, ils ont vu ce qui s'en venait :

Que les modèles ne faillissent pas en isolation. Ils échouent lorsque les pipelines de données se dégradent, quand le comportement des utilisateurs change, quand les hypothèses en amont sont rompues. Et ils croyaient que la seule façon de résoudre cela était de fermer la boucle entre la qualité des données et le comportement de l'IA.

Nous avons cru la même chose depuis le premier jour.

En réunissant nos équipes et nos plateformes, nous unifions ces couches. Offrir un produit qui peut surveiller l'ensemble de votre système, pas seulement des morceaux de celui-ci.

Ce que nous construisons ensemble

Avec l’équipe et la technologie de NannyML maintenant intégrées à Soda, voici ce que cela permet :

Détection plus intelligente au niveau du DQ

Les algorithmes de NannyML alimenteront un cœur plus intelligent dans les vérifications et l'observabilité de Soda. Réduire le bruit, faire émerger les vrais problèmes plus rapidement et s'adapter aux changements.

Alertes contextuelles à travers la pile

Suivez les anomalies à travers les systèmes : d'une dérive de colonne dans votre entrepôt, à un changement de prédiction dans votre modèle, à une modification de comportement dans vos agents.

Observabilité de bout en bout : des données à la décision

Surveillez le cycle de vie complet, pas seulement les tables ou les vérifications. Voyez comment les problèmes en amont se répercutent dans les systèmes en aval. Sachez ce qui a changé, pourquoi c'est important et ce qu'il faut corriger.

Infrastructure de qualité native à l'IA

Que vous exécutiez des analyses batch, des fonctionnalités en quasi temps réel, ou une orchestration LLM, nous construisons une infrastructure fondamentale qui maintient les données et le comportement alignés.

Et oui, le projet open-source de NannyML restera ouvert, maintenu et pleinement pris en charge. Nous ne le fermons pas. Nous l'élargissons.

Pourquoi maintenant

Parce que le coût des mauvaises données augmente, et rapidement.

Les systèmes que les données alimentent aujourd'hui sont plus cruciaux, plus rapides et plus difficiles à déboguer.

Si vos outils ne comprennent pas l'impact, ils n'aident pas. S'ils ne peuvent pas gérer l'émergence et la dérive, ils sont inutiles. Et s'ils ne sont pas conçus pour des environnements native-IA, ils sont déjà dépassés.

Nous ne sommes pas ici pour coller “IA” sur des vérifications héritées. Nous sommes ici pour rendre la qualité des données réellement intelligente :

  • Sensible à l'impact

  • Riche en contextes

  • Connecté au cycle de vie

  • Et prêt pour des systèmes qui apprennent, s'adaptent et agissent

Cette acquisition accélère cette mission.

Ce qui vient cette semaine

C'est le jour 1 de la Semaine de Lancement. Toute la semaine, nous annoncerons de nouvelles capacités et des lancements de produits qui montrent ce que signifie la qualité des données intelligente, axée sur l'IA, en pratique.

Voici un aperçu de ce qui s'en vient :

  • Les capacités de métriques les plus rapides et précises

  • Contrats de données collaboratifs

  • Un niveau gratuit pour toujours et une tarification transparente

Nous en sommes juste au début, et nous construisons rapidement.

Où aller ensuite

Regardez le webinaire d'annonce complet

Écoutez directement Maarten et Hakim à propos de ce qui change, et ce qui s'en vient.

Essayez Soda

Voyez comment notre plateforme évolue pour soutenir les équipes natives-IA. Pas de superflu, juste les signaux qui comptent.

Ceci est le prochain chapitre pour la qualité des données.

Plus intelligent. Plus rapide. Prêt pour l'IA.

Et conçu pour des équipes comme la vôtre.

Trusted by the world’s leading enterprises

Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.

At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava

Director of Data Governance, Quality and MLOps

Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake

Director of Product-Data Platform

Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta

Data Engineering Manager

Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie

Head of Data Engineering

4,4 sur 5

Commencez à faire confiance à vos données. Aujourd'hui.

Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.

Adopté par

Trusted by the world’s leading enterprises

Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.

At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava

Director of Data Governance, Quality and MLOps

Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake

Director of Product-Data Platform

Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta

Data Engineering Manager

Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie

Head of Data Engineering

4,4 sur 5

Commencez à faire confiance à vos données. Aujourd'hui.

Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.

Adopté par

Trusted by the world’s leading enterprises

Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.

At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava

Director of Data Governance, Quality and MLOps

Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake

Director of Product-Data Platform

Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta

Data Engineering Manager

Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie

Head of Data Engineering

4,4 sur 5

Commencez à faire confiance à vos données. Aujourd'hui.

Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.

Adopté par