Modèle de contrat de données média

Modèle de contrat de données média

Assurez une cohérence irréprochable entre tous vos produits de données

Assurez une cohérence irréprochable entre tous vos produits de données

Rédigez un sous-titre descriptif court pour le Data Contract ici. Une ou deux phrases suffiront amplement.

Data contract description

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Toutefois, pour apprécier l'efficacité minimale requise, il est impératif de ne pas ignorer les exercices professionnels. Le plaisir de découvrir l'impact d'une politique adéquate ne doit pas être sous-estimé. Les exceptions peuvent sembler déroutantes, mais elles servent souvent un objectif plus grand que celui prévu initialement. Soyons conscients des défis professionnels tout en maintenant notre enthousiasme et notre professionnalisme dans le domaine de la gouvernance des données et de la gestion de données.

inventory_levels_data_contract.yml

dataset
variables:
  FRESHNESS_HOURS:
    default: 24

checks:
  - schema: {}
  - row_count:
      threshold:
        must_be_greater_than: 0
  - freshness:
      column: last_updated_at
      threshold:
        unit: hour
        must_be_less_than_or_equal: ${var.FRESHNESS_HOURS}
  - failed_rows:
      name: "Stock values must never be negative"
      qualifier: non_negative_stocks
      expression: >
        stock_on_hand < 0
        OR stock_reserved < 0
        OR stock_available < 0
  - failed_rows:
      name: "Reserved stock cannot exceed stock on hand"
      qualifier: reserved_le_on_hand
      expression: stock_reserved > stock_on_hand
  - failed_rows:
      name: "Available stock must equal on_hand minus reserved"
      qualifier: available_equals_on_hand_minus_reserved
      expression: stock_available <> (stock_on_hand - stock_reserved)
  - failed_rows:
      name: "last_updated_at must not be in the future"
      qualifier: last_updated_not_future
      expression

columns:
  - name: product_id
    data_type: string
    checks:
      - missing:
          name: No missing values
  - name: location_id
    data_type: string
    checks:
      - missing:
          name: No missing values
  - name: stock_on_hand
    data_type: integer
    checks:
      - missing:
      - invalid:
          name: "Stock on hand must be zero or positive"
          valid_min: 0
  - name: stock_reserved
    data_type: integer
    checks:
      - missing:
      - invalid:
          name: "Reserved stock must be zero or positive"
          valid_min: 0
  - name: stock_available
    data_type: integer
    checks:
      - missing:
      - invalid:
          name: "Available stock must be zero or positive"
          valid_min: 0
  - name: last_updated_at
    data_type: dateTime
    checks:
      - missing

Data contract description

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Toutefois, pour apprécier l'efficacité minimale requise, il est impératif de ne pas ignorer les exercices professionnels. Le plaisir de découvrir l'impact d'une politique adéquate ne doit pas être sous-estimé. Les exceptions peuvent sembler déroutantes, mais elles servent souvent un objectif plus grand que celui prévu initialement. Soyons conscients des défis professionnels tout en maintenant notre enthousiasme et notre professionnalisme dans le domaine de la gouvernance des données et de la gestion de données.

inventory_levels_data_contract.yml

dataset
variables:
  FRESHNESS_HOURS:
    default: 24

checks:
  - schema: {}
  - row_count:
      threshold:
        must_be_greater_than: 0
  - freshness:
      column: last_updated_at
      threshold:
        unit: hour
        must_be_less_than_or_equal: ${var.FRESHNESS_HOURS}
  - failed_rows:
      name: "Stock values must never be negative"
      qualifier: non_negative_stocks
      expression: >
        stock_on_hand < 0
        OR stock_reserved < 0
        OR stock_available < 0
  - failed_rows:
      name: "Reserved stock cannot exceed stock on hand"
      qualifier: reserved_le_on_hand
      expression: stock_reserved > stock_on_hand
  - failed_rows:
      name: "Available stock must equal on_hand minus reserved"
      qualifier: available_equals_on_hand_minus_reserved
      expression: stock_available <> (stock_on_hand - stock_reserved)
  - failed_rows:
      name: "last_updated_at must not be in the future"
      qualifier: last_updated_not_future
      expression

columns:
  - name: product_id
    data_type: string
    checks:
      - missing:
          name: No missing values
  - name: location_id
    data_type: string
    checks:
      - missing:
          name: No missing values
  - name: stock_on_hand
    data_type: integer
    checks:
      - missing:
      - invalid:
          name: "Stock on hand must be zero or positive"
          valid_min: 0
  - name: stock_reserved
    data_type: integer
    checks:
      - missing:
      - invalid:
          name: "Reserved stock must be zero or positive"
          valid_min: 0
  - name: stock_available
    data_type: integer
    checks:
      - missing:
      - invalid:
          name: "Available stock must be zero or positive"
          valid_min: 0
  - name: last_updated_at
    data_type: dateTime
    checks:
      - missing

Data contract description

Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Toutefois, pour apprécier l'efficacité minimale requise, il est impératif de ne pas ignorer les exercices professionnels. Le plaisir de découvrir l'impact d'une politique adéquate ne doit pas être sous-estimé. Les exceptions peuvent sembler déroutantes, mais elles servent souvent un objectif plus grand que celui prévu initialement. Soyons conscients des défis professionnels tout en maintenant notre enthousiasme et notre professionnalisme dans le domaine de la gouvernance des données et de la gestion de données.

inventory_levels_data_contract.yml

dataset
variables:
  FRESHNESS_HOURS:
    default: 24

checks:
  - schema: {}
  - row_count:
      threshold:
        must_be_greater_than: 0
  - freshness:
      column: last_updated_at
      threshold:
        unit: hour
        must_be_less_than_or_equal: ${var.FRESHNESS_HOURS}
  - failed_rows:
      name: "Stock values must never be negative"
      qualifier: non_negative_stocks
      expression: >
        stock_on_hand < 0
        OR stock_reserved < 0
        OR stock_available < 0
  - failed_rows:
      name: "Reserved stock cannot exceed stock on hand"
      qualifier: reserved_le_on_hand
      expression: stock_reserved > stock_on_hand
  - failed_rows:
      name: "Available stock must equal on_hand minus reserved"
      qualifier: available_equals_on_hand_minus_reserved
      expression: stock_available <> (stock_on_hand - stock_reserved)
  - failed_rows:
      name: "last_updated_at must not be in the future"
      qualifier: last_updated_not_future
      expression

columns:
  - name: product_id
    data_type: string
    checks:
      - missing:
          name: No missing values
  - name: location_id
    data_type: string
    checks:
      - missing:
          name: No missing values
  - name: stock_on_hand
    data_type: integer
    checks:
      - missing:
      - invalid:
          name: "Stock on hand must be zero or positive"
          valid_min: 0
  - name: stock_reserved
    data_type: integer
    checks:
      - missing:
      - invalid:
          name: "Reserved stock must be zero or positive"
          valid_min: 0
  - name: stock_available
    data_type: integer
    checks:
      - missing:
      - invalid:
          name: "Available stock must be zero or positive"
          valid_min: 0
  - name: last_updated_at
    data_type: dateTime
    checks:
      - missing

How to Enforce Data Contracts with Soda

Embed data quality through data contracts at any point in your pipeline.

Embed data quality through data contracts at any point in your pipeline.

# pip install soda-{data source} for other data sources

pip install soda-postgress

# verify the contract locally against a data source

soda contract verify -c contract.yml -ds ds_config.yml

# publish and schedule the contract with Soda Cloud

soda contract publish -c contract.yml -sc sc_config.yml

Check out the CLI documentation to learn more.

Check out the CLI documentation to learn more.

How to Automatically Create Data Contracts.
In one Click.

Automatically write and publish data contracts using Soda's AI-powered data contract copilot.

Qualité des données IA basée sur la recherche

Nos recherches ont été publiées dans des revues et conférences de renom, telles que NeurIPs, JAIR et ACML. Les mêmes lieux qui ont fait progresser les fondations de GPT et de l'IA moderne.

Qualité des données IA basée sur la recherche

Nos recherches ont été publiées dans des revues et conférences de renom, telles que NeurIPs, JAIR et ACML. Les mêmes lieux qui ont fait progresser les fondations de GPT et de l'IA moderne.

Qualité des données IA basée sur la recherche

Nos recherches ont été publiées dans des revues et conférences de renom, telles que NeurIPs, JAIR et ACML. Les mêmes lieux qui ont fait progresser les fondations de GPT et de l'IA moderne.

4,4 sur 5

Commencez à faire confiance à vos données. Aujourd'hui.

Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.

Adopté par

4,4 sur 5

Commencez à faire confiance à vos données. Aujourd'hui.

Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.

Adopté par

4,4 sur 5

Commencez à faire confiance à vos données. Aujourd'hui.

Trouvez, comprenez et corrigez tout problème de qualité des données en quelques secondes.
Du niveau de la table au niveau des enregistrements.

Adopté par