Talend Data Integration Advanced

Talend Enterprise Data Integration offre un ensemble complet d’outils extensibles et évolutifs pour accéder aux données, les transformer et les intégrer depuis tout type de système métier en temps réel ou par lots afin de répondre à des besoins d’intégration de données à la fois opérationnels et analytiques.

Vous avez également la possibilité de travailler en équipe sur des projets partagés sur un référentiel distant ainsi que de mettre en place un monitoring des activités de vos Jobs ou des modifications dans une base de données.

Durée1 jour (7 heures)
PublicToute personne souhaitant utiliser Talend Enterprise Data Integration pour effectuer des tâches d’intégration et de gestion de données. C’est le cas par exemple des chefs de projet, des experts BI, des ingénieurs système/DBA et des ingénieurs de développement Java.
PrérequisAvoir suivi la formation Talend Data Integration Basics. Connaissances de base en informatique, notamment une connaissance de Java ou d’un autre langage de programmation ainsi que du langage SQL ou d’autres concepts généraux relatifs aux bases de données
Objectifs de la formation
À l’issue de cette formation, vous pourrez:
  • Démarrer et connecter le Studio Talend à un référentiel distant
  • Utiliser les branches SVN dans le studio
  • Exécuter un Job dans le Studio sur un Job Server distant
  • Surveiller le CPU et la mémoire Java en temps réel durant l'exécution d'un Job
  • Utiliser les capacites de debuggage du studio
  • Configurer un projet Talend pour capturer les logs et statistiques d'exécution, et les surveiller à partir d'Activity Monitoring Console (AMC)
  • Utiliser plusieurs méthodes de parallélisation dans l'exécution des Jobs Talend
  • Créer des Joblets
  • Créer des tests unitaires à partir d'un job fonctionnel
  • Configurer une base de données pour surveiller et enregistrer les changements d'état dans une base de données séparée avec les composants change data capture (CDC)
  • Utiliser une base CDC pour effectuer une mise à jour incrémentale
Programme de la formationPlan du cours:

Connexion à un référentiel distant
  • Création d’une connexion distante
Utilisation des branches SVN
  • Copie d’un Job dans une branche
  • Comparaison de Jobs
  • Réinitialisation d'une branche
Exécution d’un Job à distance
  • Création et exécution d’un Job à distance
Utilisation des ressources et débuggage basique
  • Utilisation de la vue Memory Run pour suivre l'utilisation des ressources en temps réel
  • Débuggage des Jobs avec la fonctionnalité Debug Run
Activity Monitoring Console (AMC)
  • Configuration des statistiques et des logs
  • Utilisation de l'Activity Monitoring Console
Exécution Parallèle
  • Écriture de fichiers volumineux
  • Écriture en base de données
  • Parallélisation automatique
  • Partitionnement
Joblets
  • Création d’un Joblet à partir d’un Job existant
  • Création complète d’un Joblet
  • Déclencher un Joblet
Test unitaire
  • Créer un test unitaire
Change data capture
  • Comprendre le fonctionnement du CDC
  • Configurer la base de données CDC
  • Monitoring des changements
  • Mise à jour d'une base datawarehouse
  • Remise à zéro de la base CDC