Talend Data Quality

La formation Talend Data Quality s’adresse aux utilisateurs de Talend Open Studio/Talend Integration Suite.

A l’issue de cette formation, vous serez à même d’analyser vos données, de générer des rapports, de monitorer vos données et d’en optimiser la qualité.

Si la connaissance du SQL et des logiciels d’intégration de données de Talend est un pré-requis pour bénéficier de cette formation, des connaissances métiers vous seront nécessaires pour interpréter les analyses liées à la qualité de données.

En s’appuyant en permanence sur des cas d’utilisation concrets, cette formation de 3 jours vous permet de prendre en main le logiciel Talend Data Quality.

 

Objectifs :

  1. Mettre en place des analyses permettant de suivre la qualité des données de son référentiel d’entreprise.
  2. Optimiser la qualité de ces données.

Target audience:

  1. Chef de projet
  2. Expert BI
  3. Ingénieur système / DBA
  4. Ingénieur BI, Ingénieur de Développement
  5. Architecte

Pré-requis :

  1. Connaissance du langage SQL.
  2. Talend Open Studio Foundation ou Talend Integration Suite Development

Méthode Pédagogique :

Cette formation s’appuie en permanence sur des cas d’utilisation concrets
Théorie : 20%
Pratique : 80%

Durée :

3 journée soit 21h

 1. Présentation et installation de Talend Data Quality

  1. Se familiariser avec l’architecture
  2. Découvrir les composants Data Quality

 2. Se connecter aux sources de données et lancer ces premières analyses

  1. Définir une analyse Database Structure Overview
  2. Tirer partie du Data Explorer
  3. Découvrir les analyses Schema et Catalog

 3. Analyser les données d’une colonne grâce aux patterns

  1. Générer des expressions régulières à partir des indicateurs de Pattern
  2. Définir vos propres patterns built-in
  3. Importer des patterns depuis Talend Exchange

 4. Appliquer vos règles métiers au sein d’une analyse Single Table / Multi-Column

  1. Découvrir l’analyse Single Table
  2. Créer et appliquer vos règles métiers
  3. Vérifier l’intégrité de vos données

 5. Générer vos propres rapports

  1. Générer un rapport simple
  2. Générer un rapport d’évolution - data quality monitoring

 6. Optimiser votre qualité / nettoyer vos données

  1. Extraire les données invalides
  2. Parser, standardisez et consolider vos données

 7. Définir des analyses de corrélation

  1. Créer une analyse Numerical Correlation
  2. Créer une analyse Time Correlation
  3. Créer une analyse Nominal Correlation

 8. Tirer partie du portail Data Quality

  1. Utiliser les dashboards
  2. Utiliser les rapports Talend Data Quality built-in
  3. Personnaliser vos rapports dans iReport

 9. Mettre en place un travail collaboratif - task management

  1. Créer, réviser et compléter vos rapports

10. Bénéficier de l’appui de la communauté et des services Talend

  1. Découvrir les Best Practices
  2. Promouvoir vos patterns dans la communauté Talend
  3. Utiliser les ressources et services Talend