Talend Data Quality Basics

Talend Studio for Data Quality permet aux utilisateurs métier et aux équipes de gestion des données d’évaluer le niveau de qualité des données contenues dans toute source de données. Ce produit permet également de vérifier l’exhaustivité, l’exactitude et l’intégrité des données en préparation d’une migration, d’une consolidation d’instance et d’une intégration de données.

Cette formation est conçue pour vous permettre de vous servir sans attendre de Talend Studio for Data Quality. Elle vous permet d’évaluer la qualité des données contenues dans le système d'information selon un ensemble de métriques et de seuils, grâce à une série d'indicateurs, de modèles et de règles pour chaque élément de données à analyser ou à monitorer.

DuréeDeux jours (14 heures)
PublicToute personne souhaitant utiliser Talend Studio for Data Quality pour évaluer le niveau de qualité de ses données.
PrérequisAvoir suivi le cours Talend Data Integration Basics, connaissance du SQL.
Objectifs de la formation
À l’issue de cette formation, vous pourrez :
  • Vous connecter à une source de données (base de données ou fichier délimité) et exécuter une analyse de données sur cette source.
  • Examiner le contenu d’une connexion à une source de données.
  • Effectuer une analyse de données à l’aide des outils d’analyse de schémas et de catalogues.
  • Créer, configurer, exécuter et analyser les résultats pour tout type d’analyse de qualité de données proposé dans le Studio sur plusieurs jeux de données d’exemple. Cela comprend le profiling de données sur les catégories d’analyse suivantes : structurelle, de colonnes, de table, inter-tables et de corrélation.
  • Générer des expressions régulières pour la correspondance de modèles dans le cadre d’une analyse pour tester la qualité des données.
  • Définir des seuils sur les indicateurs marqués dans les résultats d’analyse en cas de violation.
  • Créer et appliquer un ensemble de règles métier pour séparer les données conformes des données non conformes.
Programme de la formation

Création de connexions

  • Création d’une connexion à une base de données et à un fichier délimité

Analyse structurelle

  • Utilisation d’une analyse de vue d’ensemble de la connexion
  • Utilisation d’une analyse de vue d’ensemble du catalogue
Analyse de colonne
  • Exécution d’une analyse de colonne
  • Ajout d’expressions régulières
  • Ajout de seuils sur les indicateurs
  • Exécution d’analyses de colonnes simples supplémentaires
  • Exécution et reconfiguration d’analyses de colonnes prédéfinies

Connexion et analyse du catalogue

  • Description de l’exercice
  • Analyse de la connexion (vue d’ensemble de la structure de la base de données)
  • Analyse du catalogue (vue d’ensemble de la structure du catalogue)
  • Exercices et solutions
  • Conclusion
Analyse de découverte sémantique
  • Configuration et utilisation d'une analyse de découverte sémantique
Analyse de table
  • Utilisation d’une analyse d’un ensemble de colonnes
  • Utilisation d’une analyse de rapprochement
  • Utilisation d’une analyse de règle métier
  • Utilisation d’une analyse de dépendance fonctionnelle
Analyse inter-tables
  • Utilisation d’une analyse de redondance
Analyse de corrélation
  • Utilisation d'une analyse de corrélation numérique
  • Utilisation d'une analyse de corrélation temporelle
  • Utilisation d'une analyse de corrélation nominale
Tâches
  • Définition et gestion des tâches dans la perspective Profiling