Talend Data Quality Pack#1

A l’issue de cette formation, vous serez à même de développer vos jobs en tirant parti de la puissance des composants avancés du logiciel et du langage Java ; vous serez a même d’analyser vos donnees, et d’en optimiser la qualité.

Si seule la connaissance du SQL est un pré-requis pour bénéficier de cette formation, des connaissances métiers vous seront nécessaires pour interpréter les analyses liées à la qualité de données.

En s’appuyant en permanence sur des cas d’utilisation concrets, cette formation d’une journée vous permet de prendre en main le logiciel Talend Open Profiler.

 

Objectifs :

  1. Modéliser ses besoins
  2. Maîtriser la bibliothèque de composants
  3. Implémenter ses Jobs
  4. Mettre en place des analyses permettant de suivre la qualité de ses données et en optimiser la qualité.

Public :

  1. Chef de projet
  2. Expert BI
  3. Ingénieur système / DBA
  4. Ingénieur BI, Ingénieur de Développement
  5. Architecte

Pré-requis :

  1. Connaissance du langage SQL.
  2. La connaissance du langage Java est un plus.

Méthode Pédagogique :

Cette formation s’appuie en permanence sur des cas d’utilisation concrets
Théorie : 20%
Pratique : 80%

Durée :

5 jours soit 35h

 1. Prendre en main Talend Open Studio

  1. Modéliser ses besoins & documenter son projet
  2. Utiliser le Job Designer pour générer son code
  3. Gérer les accès aux fichiers et les accès aux bases de données
  4. Utiliser les différents composants de transformation
  5. Fédérer ses metadatas dans le Référentiel
  6. Maîtriser les fonctionnalités avancées
  7. Debugger ses scripts et déployer ses jobs

 2. Présentation et installation de Talend Data Quality

  1. Présentation et installation de Talend Data Quality

 3. Se connecter aux sources de données et lancer ces premières analyses

  1. Se connecter aux sources de données et lancer ces premières analyses

 4. Analyser les données d’une colonne grâce aux patterns

  1. Générer des expresssions régulières à partir des indicateurs de Pattern
  2. Définisser vos propres patterns built-in
  3. Importer des patterns depuis Talend Exchange

 5. Appliquer vos règles métiers au sein d’une analyse Single Table / Multi-Column

  1. Découvrer l’analyse Single Table
  2. Créer et appliquer vos règles métiers
  3. Vérifier l’intégrité de vos données

 6. Générer vos propres rapports

  1. Générer un rapport simple
  2. Générer un rapport d’évolution - data quality monitoring

 7. Optimiser votre qualité / nettoyer vos données

  1. Extraire les données invalides
  2. Parser, standardisez et consolider vos données

 8. Définir des analyses de corrélation

  1. Créer une analyse Numerical Correlation
  2. Créer une analyse Time Correlation
  3. Créer une analyse Nominal Correlation

 9. Tirer partie du portail Data Quality

  1. Utiliser les dashboards
  2. Utiliser les rapports Talend Data Quality built-in
  3. Personnaliser vos rapports dans iReport

10. Mettre en place un travail collaboratif - task management

  1. Créer, réviser et compléter vos rapports

11. Bénéficier de l’appui de la communauté et des services Talend

  1. Découvrer les Best Practices
  2. Promouvoir vos patterns dans la communauté Talend
  3. Utiliser les ressources et services Talend