Talend Data Quality Essentials

Talend Studio for Data Quality permet aux utilisateurs professionnels et aux équipes de gestion des données d’évaluer le niveau de qualité des données contenues dans toute source de données. Ce produit permet également de vérifier l’exhaustivité, l’exactitude et l’intégrité des données en préparation d’une migration, d’une consolidation d’instance et d’une intégration de données

Cette formation est conçue pour vous permettre de vous servir sans attendre de Talend Studio for Data Quality. Elle vous permet d’évaluer la qualité des données contenues dans le système d'information selon un ensemble de métriques et de seuils, grâce à une série d'indicateurs, de modèles et de règles pour chaque élément de données à analyser ou à monitorer.

Durée2 jours (14 heures)
PublicToute personne souhaitant utiliser Talend Studio for Data Quality pour évaluer le niveau de qualité de ses données
PrérequisConnaissance du langage SQL. Avoir suivi la formation Talend Data Integration Basics
Objectifs de la formation
À l’issue de cette formation, vous pourrez :

  • Vous connecter à une base de données et y exécuter une analyse
  • Examiner le contenu d’une connexion à une source de données
  • Créer, configurer et lancer une analyse sur une colonne
  • Générer des expressions régulières pour analyser la qualité de données via le pattern matching 
  • Définir des seuils de qualité et lever des alertes lors d'une analyse
  • Créer, configurer et exécuter différents types d'analyse de table
  • Définir une règle métier SQL et l'appliquer à une analyse pour identifier les données conflictuelles
  • Créer, configurer et exécuter une analyse afin d'identifier les données en doublon
  • Utiliser le matching avancé pour améliorer l'identification des doublons
  • Garantir l'anonymisation d'un jeu de données en masquant et mélangeant des informations client
  • Afficher des rapports d'analyse sur le Data Quality Portal ou au format PDF
Programme de la formationPlan du cours:

Analyse structurelle

  • Créer une connexion à une base de données
  • Exécuter une analyse structurelle

Analyse de colonne
  • Exécution une analyse de colonne simple
  • Utiliser des expressions régulières
  • Définir des indicateurs de seuil d'alerte
  • Appliquer des statistiques avancées
  • Générer un Job à partir d'une analyse

Analyse de table
  • Utiliser l'analyse multi-colonnes
  • Utiliser une analyse de règle métier

Analyse cross-tables
  • Utiliser l'analyse multi-colonnes

Matching avancé
  • Préparer une analyse de correspondance
  • Tester le processus d'analyse de correspondance
  • Exécuter une analyse de correspondance
  • Configurer les paramètres avancés pour l'analyse de correspondance sur une table
  • Utiliser un Job d'intégration de matching

Gestion des données privées
  • Mélanger les données privées (shuffling)
  • Masquer les données privées

Rapports et Data Quality portal
  • Configuration du Data Quality database
  • Créer un rapport
  • Créer un rapport d'évolution
  • Exécuter la génération des rapports sur Data Quality Portal