Talend Data Integration Advanced

Talend Data Integration offre un ensemble complet d’outils extensibles et évolutifs pour accéder aux données, les transformer et les intégrer depuis tout type de système métier. Cette formation vous permet d’utiliser rapidement les fonctionnalités les plus avancées de Talend Data Integration. Vous avez également la possibilité de travailler en équipe sur des projets partagés dans un référentiel distant pour monitorer les modifications sur les Jobs et les bases de données.

Durée 1 jour
(7 heures)
Public Toute personne souhaitant utiliser Talend Data Integration pour effectuer des tâches d’intégration et de gestion de données : développeurs et responsables développement.
Pré-requis Avoir suivi la formation Talend Data Integration Basics. Connaissances de base en informatique, notamment une connaissance de Java ou d’un autre langage de programmation ainsi que du langage SQL ou d’autres concepts généraux relatifs aux bases de données.
Objectifs

À l’issue de cette formation, vous pourrez :

  • Démarrer et connecter le Studio Talend à un référentiel distant
  • Utiliser les branches SVN dans le Studio
  • Exécuter un Job dans le Studio sur un serveur de Jobs distant
  • Monitorer le CPU et la mémoire de la JVM en temps réel durant l’exécution d’un Job
  • Utiliser les fonctionnalités de débogage du Studio
  • Configurer un projet Talend pour capturer les statistiques et les logs, et les monitorer à partir d’Activity Monitoring Console (AMC)
  • Implémenter plusieurs méthodes d’exécution parallèle dans un Job Talend
  • Créer des Joblets
  • Créer un test unitaire à partir d’un Job fonctionnel
  • Configurer une base de données pour monitorer et enregistrer les changements dans une base de données change data capture (CDC) séparée
  • Utiliser une base de données CDC pour effectuer des mises à jour incrémentales entre la source et la cible
  • Mettre en place un projet de référence afin d’utiliser des éléments à partir d’un autre projet
Plan du cours

Connexion à un référentiel distant

  • Créer une connexion distante

SVN dans le Studio

  • Copier un Job dans une branche
  • Comparer des Jobs
  • Réinitialiser une branche

Projet de référence

  • Projet de référence
  • Mettre en place et utiliser un projet de référence

Exécution d’un Job à distance

  • Créer et exécuter un Job à distance

Utilisation des ressources et débogage basique

  • Utiliser la vue Memory Run pour suivre l’utilisation des ressources en temps réel
  • Déboguer des Jobs avec la fonctionnalité Debug Run

Activity Monitoring Console (AMC)

  • Configurer des statistiques et des logs
  • Utiliser Activity Monitoring Console

Exécution Parallèle

  • Écrire des fichiers volumineux
  • Écrire vers des bases de données
  • Parallélisation automatique
  • Partitionnement

Joblets

  • Créer un Joblet à partir d’un Job existant
  • Créer entièrement un Joblet
  • Déclencher des Joblets

Test unitaire

  • Créer un test unitaire

Change data capture (CDC)

  • Analyser des bases de données
  • Configurer la base de données CDC
  • Monitorer des changements
  • Mettre à jour un entrepôt de données
  • Réinitialiser la base de données