Table des matières



Aujourd'hui nous lançons la Semaine de Lancement Soda avec une annonce majeure : Soda a acquis NannyML.
Ensemble, nous construisons la plateforme de qualité des données la plus intelligente et contextuelle du marché. Une solution qui vous aide à prévenir les problèmes avant qu’ils ne deviennent des problèmes d'affaires, à détecter les anomalies qui comptent vraiment et à identifier les causes profondes à travers toute la pile, depuis l'ingestion de données jusqu'à la prise de décision automatisée.
Ce mouvement réunit deux équipes avec un objectif commun : aider les équipes de données et d'IA à livrer des systèmes fiables, de qualité de production, en lesquels elles peuvent avoir confiance, que ces systèmes alimentent des tableaux de bord, des modèles ou des agents autonomes.
Voyons ce que cela signifie, pourquoi nous le faisons et ce qui s'en vient.
Le fossé dans la qualité des données s'aggrave
Si vous avez travaillé sur des infrastructures de données ou d'IA, vous avez vécu cela :
Un pipeline laisse silencieusement tomber une colonne, pas d'échec de schéma, mais une métrique en aval s'aplatit.
Un tableau de bord montre soudainement une baisse de 30 % des revenus, et personne ne sait pourquoi.
Un modèle en production commence à dériver en raison de légers changements dans le comportement des utilisateurs.
Un agent se réentraîne ou réagit en se basant sur des données corrompues, et personne ne s'en aperçoit avant que des décisions soient prises.
La plupart des outils de qualité des données actuels ne peuvent pas gérer cela. Ils ont été conçus pour une autre ère de traitements par lot, de schémas statiques, de flux de données prévisibles. Ils signalent trop de bruit, manquent de contexte critique et montrent rarement l'impact en aval.
En même temps, les systèmes que nous construisons aujourd'hui sont plus dynamiques que jamais :
Agents
Décision basée sur LLM
Personnalisation en temps réel
Pipelines hybrides batch-streaming
Boucles de réentraînement continus
Dans ce monde, les vérifications traditionnelles et la détection d'anomalies ne suffisent plus. La qualité des données n'est plus seulement une question de correction, c'est une question de conséquence.
Pourquoi NannyML
NannyML a abordé l’un des problèmes les plus difficiles des systèmes d'IA modernes :
Comment surveillez-vous la performance des modèles en production, quand il n'y a pas encore de vérité terrain ?
Leur bibliothèque open-source a introduit la surveillance de performance basée sur l'estimation, la détection robuste des dérives, et l'alerting conçu pour des pipelines ML réels. Elle est devenue la boîte à outils incontournable pour les équipes exécutant des modèles où les étiquettes sont retardées, rares ou indisponibles.
Mais plus important encore, ils ont vu ce qui s'en venait :
Que les modèles ne faillissent pas en isolation. Ils échouent lorsque les pipelines de données se dégradent, quand le comportement des utilisateurs change, quand les hypothèses en amont sont rompues. Et ils croyaient que la seule façon de résoudre cela était de fermer la boucle entre la qualité des données et le comportement de l'IA.
Nous avons cru la même chose depuis le premier jour.
En réunissant nos équipes et nos plateformes, nous unifions ces couches. Offrir un produit qui peut surveiller l'ensemble de votre système, pas seulement des morceaux de celui-ci.
Ce que nous construisons ensemble
Avec l’équipe et la technologie de NannyML maintenant intégrées à Soda, voici ce que cela permet :
Détection plus intelligente au niveau du DQ
Les algorithmes de NannyML alimenteront un cœur plus intelligent dans les vérifications et l'observabilité de Soda. Réduire le bruit, faire émerger les vrais problèmes plus rapidement et s'adapter aux changements.
Alertes contextuelles à travers la pile
Suivez les anomalies à travers les systèmes : d'une dérive de colonne dans votre entrepôt, à un changement de prédiction dans votre modèle, à une modification de comportement dans vos agents.
Observabilité de bout en bout : des données à la décision
Surveillez le cycle de vie complet, pas seulement les tables ou les vérifications. Voyez comment les problèmes en amont se répercutent dans les systèmes en aval. Sachez ce qui a changé, pourquoi c'est important et ce qu'il faut corriger.
Infrastructure de qualité native à l'IA
Que vous exécutiez des analyses batch, des fonctionnalités en quasi temps réel, ou une orchestration LLM, nous construisons une infrastructure fondamentale qui maintient les données et le comportement alignés.
Et oui, le projet open-source de NannyML restera ouvert, maintenu et pleinement pris en charge. Nous ne le fermons pas. Nous l'élargissons.
Pourquoi maintenant
Parce que le coût des mauvaises données augmente, et rapidement.
Les systèmes que les données alimentent aujourd'hui sont plus cruciaux, plus rapides et plus difficiles à déboguer.
Si vos outils ne comprennent pas l'impact, ils n'aident pas. S'ils ne peuvent pas gérer l'émergence et la dérive, ils sont inutiles. Et s'ils ne sont pas conçus pour des environnements native-IA, ils sont déjà dépassés.
Nous ne sommes pas ici pour coller “IA” sur des vérifications héritées. Nous sommes ici pour rendre la qualité des données réellement intelligente :
Sensible à l'impact
Riche en contextes
Connecté au cycle de vie
Et prêt pour des systèmes qui apprennent, s'adaptent et agissent
Cette acquisition accélère cette mission.
Ce qui vient cette semaine
C'est le jour 1 de la Semaine de Lancement. Toute la semaine, nous annoncerons de nouvelles capacités et des lancements de produits qui montrent ce que signifie la qualité des données intelligente, axée sur l'IA, en pratique.
Voici un aperçu de ce qui s'en vient :
Les capacités de métriques les plus rapides et précises
Contrats de données collaboratifs
Un niveau gratuit pour toujours et une tarification transparente
Nous en sommes juste au début, et nous construisons rapidement.
Où aller ensuite
Regardez le webinaire d'annonce complet
Écoutez directement Maarten et Hakim à propos de ce qui change, et ce qui s'en vient.
Essayez Soda
Voyez comment notre plateforme évolue pour soutenir les équipes natives-IA. Pas de superflu, juste les signaux qui comptent.
Ceci est le prochain chapitre pour la qualité des données.
Plus intelligent. Plus rapide. Prêt pour l'IA.
Et conçu pour des équipes comme la vôtre.
Aujourd'hui nous lançons la Semaine de Lancement Soda avec une annonce majeure : Soda a acquis NannyML.
Ensemble, nous construisons la plateforme de qualité des données la plus intelligente et contextuelle du marché. Une solution qui vous aide à prévenir les problèmes avant qu’ils ne deviennent des problèmes d'affaires, à détecter les anomalies qui comptent vraiment et à identifier les causes profondes à travers toute la pile, depuis l'ingestion de données jusqu'à la prise de décision automatisée.
Ce mouvement réunit deux équipes avec un objectif commun : aider les équipes de données et d'IA à livrer des systèmes fiables, de qualité de production, en lesquels elles peuvent avoir confiance, que ces systèmes alimentent des tableaux de bord, des modèles ou des agents autonomes.
Voyons ce que cela signifie, pourquoi nous le faisons et ce qui s'en vient.
Le fossé dans la qualité des données s'aggrave
Si vous avez travaillé sur des infrastructures de données ou d'IA, vous avez vécu cela :
Un pipeline laisse silencieusement tomber une colonne, pas d'échec de schéma, mais une métrique en aval s'aplatit.
Un tableau de bord montre soudainement une baisse de 30 % des revenus, et personne ne sait pourquoi.
Un modèle en production commence à dériver en raison de légers changements dans le comportement des utilisateurs.
Un agent se réentraîne ou réagit en se basant sur des données corrompues, et personne ne s'en aperçoit avant que des décisions soient prises.
La plupart des outils de qualité des données actuels ne peuvent pas gérer cela. Ils ont été conçus pour une autre ère de traitements par lot, de schémas statiques, de flux de données prévisibles. Ils signalent trop de bruit, manquent de contexte critique et montrent rarement l'impact en aval.
En même temps, les systèmes que nous construisons aujourd'hui sont plus dynamiques que jamais :
Agents
Décision basée sur LLM
Personnalisation en temps réel
Pipelines hybrides batch-streaming
Boucles de réentraînement continus
Dans ce monde, les vérifications traditionnelles et la détection d'anomalies ne suffisent plus. La qualité des données n'est plus seulement une question de correction, c'est une question de conséquence.
Pourquoi NannyML
NannyML a abordé l’un des problèmes les plus difficiles des systèmes d'IA modernes :
Comment surveillez-vous la performance des modèles en production, quand il n'y a pas encore de vérité terrain ?
Leur bibliothèque open-source a introduit la surveillance de performance basée sur l'estimation, la détection robuste des dérives, et l'alerting conçu pour des pipelines ML réels. Elle est devenue la boîte à outils incontournable pour les équipes exécutant des modèles où les étiquettes sont retardées, rares ou indisponibles.
Mais plus important encore, ils ont vu ce qui s'en venait :
Que les modèles ne faillissent pas en isolation. Ils échouent lorsque les pipelines de données se dégradent, quand le comportement des utilisateurs change, quand les hypothèses en amont sont rompues. Et ils croyaient que la seule façon de résoudre cela était de fermer la boucle entre la qualité des données et le comportement de l'IA.
Nous avons cru la même chose depuis le premier jour.
En réunissant nos équipes et nos plateformes, nous unifions ces couches. Offrir un produit qui peut surveiller l'ensemble de votre système, pas seulement des morceaux de celui-ci.
Ce que nous construisons ensemble
Avec l’équipe et la technologie de NannyML maintenant intégrées à Soda, voici ce que cela permet :
Détection plus intelligente au niveau du DQ
Les algorithmes de NannyML alimenteront un cœur plus intelligent dans les vérifications et l'observabilité de Soda. Réduire le bruit, faire émerger les vrais problèmes plus rapidement et s'adapter aux changements.
Alertes contextuelles à travers la pile
Suivez les anomalies à travers les systèmes : d'une dérive de colonne dans votre entrepôt, à un changement de prédiction dans votre modèle, à une modification de comportement dans vos agents.
Observabilité de bout en bout : des données à la décision
Surveillez le cycle de vie complet, pas seulement les tables ou les vérifications. Voyez comment les problèmes en amont se répercutent dans les systèmes en aval. Sachez ce qui a changé, pourquoi c'est important et ce qu'il faut corriger.
Infrastructure de qualité native à l'IA
Que vous exécutiez des analyses batch, des fonctionnalités en quasi temps réel, ou une orchestration LLM, nous construisons une infrastructure fondamentale qui maintient les données et le comportement alignés.
Et oui, le projet open-source de NannyML restera ouvert, maintenu et pleinement pris en charge. Nous ne le fermons pas. Nous l'élargissons.
Pourquoi maintenant
Parce que le coût des mauvaises données augmente, et rapidement.
Les systèmes que les données alimentent aujourd'hui sont plus cruciaux, plus rapides et plus difficiles à déboguer.
Si vos outils ne comprennent pas l'impact, ils n'aident pas. S'ils ne peuvent pas gérer l'émergence et la dérive, ils sont inutiles. Et s'ils ne sont pas conçus pour des environnements native-IA, ils sont déjà dépassés.
Nous ne sommes pas ici pour coller “IA” sur des vérifications héritées. Nous sommes ici pour rendre la qualité des données réellement intelligente :
Sensible à l'impact
Riche en contextes
Connecté au cycle de vie
Et prêt pour des systèmes qui apprennent, s'adaptent et agissent
Cette acquisition accélère cette mission.
Ce qui vient cette semaine
C'est le jour 1 de la Semaine de Lancement. Toute la semaine, nous annoncerons de nouvelles capacités et des lancements de produits qui montrent ce que signifie la qualité des données intelligente, axée sur l'IA, en pratique.
Voici un aperçu de ce qui s'en vient :
Les capacités de métriques les plus rapides et précises
Contrats de données collaboratifs
Un niveau gratuit pour toujours et une tarification transparente
Nous en sommes juste au début, et nous construisons rapidement.
Où aller ensuite
Regardez le webinaire d'annonce complet
Écoutez directement Maarten et Hakim à propos de ce qui change, et ce qui s'en vient.
Essayez Soda
Voyez comment notre plateforme évolue pour soutenir les équipes natives-IA. Pas de superflu, juste les signaux qui comptent.
Ceci est le prochain chapitre pour la qualité des données.
Plus intelligent. Plus rapide. Prêt pour l'IA.
Et conçu pour des équipes comme la vôtre.
Aujourd'hui nous lançons la Semaine de Lancement Soda avec une annonce majeure : Soda a acquis NannyML.
Ensemble, nous construisons la plateforme de qualité des données la plus intelligente et contextuelle du marché. Une solution qui vous aide à prévenir les problèmes avant qu’ils ne deviennent des problèmes d'affaires, à détecter les anomalies qui comptent vraiment et à identifier les causes profondes à travers toute la pile, depuis l'ingestion de données jusqu'à la prise de décision automatisée.
Ce mouvement réunit deux équipes avec un objectif commun : aider les équipes de données et d'IA à livrer des systèmes fiables, de qualité de production, en lesquels elles peuvent avoir confiance, que ces systèmes alimentent des tableaux de bord, des modèles ou des agents autonomes.
Voyons ce que cela signifie, pourquoi nous le faisons et ce qui s'en vient.
Le fossé dans la qualité des données s'aggrave
Si vous avez travaillé sur des infrastructures de données ou d'IA, vous avez vécu cela :
Un pipeline laisse silencieusement tomber une colonne, pas d'échec de schéma, mais une métrique en aval s'aplatit.
Un tableau de bord montre soudainement une baisse de 30 % des revenus, et personne ne sait pourquoi.
Un modèle en production commence à dériver en raison de légers changements dans le comportement des utilisateurs.
Un agent se réentraîne ou réagit en se basant sur des données corrompues, et personne ne s'en aperçoit avant que des décisions soient prises.
La plupart des outils de qualité des données actuels ne peuvent pas gérer cela. Ils ont été conçus pour une autre ère de traitements par lot, de schémas statiques, de flux de données prévisibles. Ils signalent trop de bruit, manquent de contexte critique et montrent rarement l'impact en aval.
En même temps, les systèmes que nous construisons aujourd'hui sont plus dynamiques que jamais :
Agents
Décision basée sur LLM
Personnalisation en temps réel
Pipelines hybrides batch-streaming
Boucles de réentraînement continus
Dans ce monde, les vérifications traditionnelles et la détection d'anomalies ne suffisent plus. La qualité des données n'est plus seulement une question de correction, c'est une question de conséquence.
Pourquoi NannyML
NannyML a abordé l’un des problèmes les plus difficiles des systèmes d'IA modernes :
Comment surveillez-vous la performance des modèles en production, quand il n'y a pas encore de vérité terrain ?
Leur bibliothèque open-source a introduit la surveillance de performance basée sur l'estimation, la détection robuste des dérives, et l'alerting conçu pour des pipelines ML réels. Elle est devenue la boîte à outils incontournable pour les équipes exécutant des modèles où les étiquettes sont retardées, rares ou indisponibles.
Mais plus important encore, ils ont vu ce qui s'en venait :
Que les modèles ne faillissent pas en isolation. Ils échouent lorsque les pipelines de données se dégradent, quand le comportement des utilisateurs change, quand les hypothèses en amont sont rompues. Et ils croyaient que la seule façon de résoudre cela était de fermer la boucle entre la qualité des données et le comportement de l'IA.
Nous avons cru la même chose depuis le premier jour.
En réunissant nos équipes et nos plateformes, nous unifions ces couches. Offrir un produit qui peut surveiller l'ensemble de votre système, pas seulement des morceaux de celui-ci.
Ce que nous construisons ensemble
Avec l’équipe et la technologie de NannyML maintenant intégrées à Soda, voici ce que cela permet :
Détection plus intelligente au niveau du DQ
Les algorithmes de NannyML alimenteront un cœur plus intelligent dans les vérifications et l'observabilité de Soda. Réduire le bruit, faire émerger les vrais problèmes plus rapidement et s'adapter aux changements.
Alertes contextuelles à travers la pile
Suivez les anomalies à travers les systèmes : d'une dérive de colonne dans votre entrepôt, à un changement de prédiction dans votre modèle, à une modification de comportement dans vos agents.
Observabilité de bout en bout : des données à la décision
Surveillez le cycle de vie complet, pas seulement les tables ou les vérifications. Voyez comment les problèmes en amont se répercutent dans les systèmes en aval. Sachez ce qui a changé, pourquoi c'est important et ce qu'il faut corriger.
Infrastructure de qualité native à l'IA
Que vous exécutiez des analyses batch, des fonctionnalités en quasi temps réel, ou une orchestration LLM, nous construisons une infrastructure fondamentale qui maintient les données et le comportement alignés.
Et oui, le projet open-source de NannyML restera ouvert, maintenu et pleinement pris en charge. Nous ne le fermons pas. Nous l'élargissons.
Pourquoi maintenant
Parce que le coût des mauvaises données augmente, et rapidement.
Les systèmes que les données alimentent aujourd'hui sont plus cruciaux, plus rapides et plus difficiles à déboguer.
Si vos outils ne comprennent pas l'impact, ils n'aident pas. S'ils ne peuvent pas gérer l'émergence et la dérive, ils sont inutiles. Et s'ils ne sont pas conçus pour des environnements native-IA, ils sont déjà dépassés.
Nous ne sommes pas ici pour coller “IA” sur des vérifications héritées. Nous sommes ici pour rendre la qualité des données réellement intelligente :
Sensible à l'impact
Riche en contextes
Connecté au cycle de vie
Et prêt pour des systèmes qui apprennent, s'adaptent et agissent
Cette acquisition accélère cette mission.
Ce qui vient cette semaine
C'est le jour 1 de la Semaine de Lancement. Toute la semaine, nous annoncerons de nouvelles capacités et des lancements de produits qui montrent ce que signifie la qualité des données intelligente, axée sur l'IA, en pratique.
Voici un aperçu de ce qui s'en vient :
Les capacités de métriques les plus rapides et précises
Contrats de données collaboratifs
Un niveau gratuit pour toujours et une tarification transparente
Nous en sommes juste au début, et nous construisons rapidement.
Où aller ensuite
Regardez le webinaire d'annonce complet
Écoutez directement Maarten et Hakim à propos de ce qui change, et ce qui s'en vient.
Essayez Soda
Voyez comment notre plateforme évolue pour soutenir les équipes natives-IA. Pas de superflu, juste les signaux qui comptent.
Ceci est le prochain chapitre pour la qualité des données.
Plus intelligent. Plus rapide. Prêt pour l'IA.
Et conçu pour des équipes comme la vôtre.
Trusted by the world’s leading enterprises
Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.
At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava
Director of Data Governance, Quality and MLOps
Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake
Director of Product-Data Platform
Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta
Data Engineering Manager
Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie
Head of Data Engineering
4,4 sur 5
Commencez à faire confiance à vos données. Aujourd'hui.
Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.
Adopté par




Trusted by the world’s leading enterprises
Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.
At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava
Director of Data Governance, Quality and MLOps
Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake
Director of Product-Data Platform
Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta
Data Engineering Manager
Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie
Head of Data Engineering
4,4 sur 5
Commencez à faire confiance à vos données. Aujourd'hui.
Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.
Adopté par
Solutions




Trusted by the world’s leading enterprises
Real stories from companies using Soda to keep their data reliable, accurate, and ready for action.
At the end of the day, we don’t want to be in there managing the checks, updating the checks, adding the checks. We just want to go and observe what’s happening, and that’s what Soda is enabling right now.

Sid Srivastava
Director of Data Governance, Quality and MLOps
Investing in data quality is key for cross-functional teams to make accurate, complete decisions with fewer risks and greater returns, using initiatives such as product thinking, data governance, and self-service platforms.

Mario Konschake
Director of Product-Data Platform
Soda has integrated seamlessly into our technology stack and given us the confidence to find, analyze, implement, and resolve data issues through a simple self-serve capability.

Sutaraj Dutta
Data Engineering Manager
Our goal was to deliver high-quality datasets in near real-time, ensuring dashboards reflect live data as it flows in. But beyond solving technical challenges, we wanted to spark a cultural shift - empowering the entire organization to make decisions grounded in accurate, timely data.

Gu Xie
Head of Data Engineering
4,4 sur 5
Commencez à faire confiance à vos données. Aujourd'hui.
Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.
Adopté par
Solutions




