Talend Data Quality Essentials

Talend Studio for Data Quality permet aux utilisateurs professionnels et aux équipes de gestion des données d’évaluer le niveau de qualité des données contenues dans toute source de données. Ce produit permet également de vérifier l’exhaustivité, l’exactitude et l’intégrité des données en préparation d’une migration, d’une consolidation d’instance et d’une intégration de données.

Cette formation est conçue pour vous permettre de vous servir, sans attendre, de Talend Studio for Data Quality. Elle vous permet d’évaluer la qualité des données contenues dans le système d’information selon un ensemble de métriques et de seuils, grâce à une série d’indicateurs, de modèles et de règles pour chaque élément de données à analyser ou à monitorer.

Durée2 jours
(14 heures)
PublicToute personne souhaitant utiliser Talend Studio for Data Quality pour évaluer le niveau de qualité de ses données.
Pré-requis Connaissance du langage SQL. Avoir suivi les formations Introduction to Talend Studio ou Talend Data Integration Basics.
Objectifs

À l’issue de cette formation, vous pourrez :

  • Vous connecter à une base de données et y exécuter une analyse
  • Examiner le contenu d’une connexion à une source de données
  • Créer, configurer et lancer une analyse sur une colonne
  • Générer des expressions régulières pour analyser la qualité de données via le pattern matching
  • Définir des seuils de qualité et lever des alertes lors d’une analyse
  • Créer, configurer et exécuter différents types d’analyse de table
  • Définir une règle métier SQL et l’appliquer à une analyse pour identifier les données conflictuelles
  • Créer, configurer et exécuter une analyse de correspondance sur une table afin d’identifier les données en doublon
  • Utiliser le matching avancé pour améliorer l’identification des doublons
  • Garantir l’anonymisation des données en masquant et en mélangeant des informations client
  • Afficher des rapports d’analyse sur le Data Quality Portal ou au format PDF
Plan du cours

Introduction à Data Quality

  • Concepts
  • Résumé des types d’analyse

Analyse structurelle

  • Créer une connexion à une base de données
  • Exécuter des analyses structurelles

Analyse de colonne

  • Exécuter une analyse de colonne simple
  • Utiliser des expressions régulières
  • Définir des indicateurs de seuil d’alerte
  • Appliquer des statistiques avancées
  • Générer des Jobs à partir d’une analyse

Analyse de table

  • Utiliser l’analyse multi-colonnes
  • Utiliser une analyse de règle métier

Analyse cross-table

  • Utiliser une analyse de redondance

Matching avancé

  • Préparer une analyse de correspondance
  • Tester le processus d’analyse de correspondance
  • Exécuter une analyse de correspondance
  • Configurer les paramètres avancés pour l’analyse de correspondance sur une table
  • Utiliser un Job d’intégration de matching

Nettoyage des données

  • Standardiser des codes pays
  • Dédupliquer des adresses

Confidentialité des données

  • Mélanger les données pour en assurer la confidentialité (shuffling)
  • Masquer les données pour en assurer la confidentialité

Rapports et Data Quality Portal

  • Configurer la base de données de qualité de données
  • Créer un rapport
  • Créer un rapport d’évolution
  • Configurer le Data Quality Portal
  • Exécuter la génération des rapports sur Data Quality Portal