Talend Data Quality Advanced

Ce cours traite de l’utilisation d’outils pour isoler, monitorer et corriger les valeurs non conformes dans un jeu de données. Il développe les concepts abordés dans la formation Talend Data Quality Basics pour couvrir le nettoyage avancé des problèmes de qualité des données.

DuréeUn jour (7 heures)
PublicToute personne souhaitant utiliser la solution de qualité de donnée pour évaluer la qualité des données
PrérequisAvoir suivi les formations Talend Data Integration Basics et Talend Data Quality Basics, être familier avec le SQL
Objectifs de la formation
À l’issue de cette formation, vous pourrez :
  • Isoler les données non conformes pour les examiner, les évaluer et les nettoyer
  • Supprimer les données invalides d’un jeu de données
  • Analyser, standardiser et consolider les données avant de les envoyer vers leur destination
  • Nettoyer un ensemble de données afin qu’il contienne uniquement des valeurs conformes
  • Utiliser Talend Data Stewardship Console
  • Utiliser Talend Data Quality Portal
  • Utiliser les dashboards pour monitorer la qualité de données
  • Créer et vérifier les rapports
Programme de la formation

Démarrage avec Talend et récupération des schémas

  • Extraction des schémas des tables

Identification des données non valides

  • Identification des données invalides dans la perspective Profiling
  • Identification des données invalides dans la perspective Integration
Parsing de données
  • Parsing de données dans la perspective Profiling
  • Parsing de données dans la perspective Integration
Création d’une table Lookup
  • Création et utilisation de tables de référence
Standardisation des données
  • Construction d'un Job d'intégration
  • Consolidation des données
Identification des enregistrements dupliqués
  • Identification des doublons dans la perspective Profiling
  • Export d’une règle de rapprochement
  • Identification des doublons dans la perspective Integration
Résolution des conflits
  • Création de tâches de résolution de conflits
  • Résolution de deux enregistrements correspondants
  • Mise à jour de la base de données
Rapports
  • Configuration de la base de qualité de données
  • Création et exécution de rapports sur des analyses simples et multiples
  • Utilisation des rapports d'évolution pour voir les changements au fil du temps
Talend Data Quality Portal
  • Accès à Talend Data Quality Portal
  • Exécution de rapports