Journée typique d’un développeur d’intégration de données : Exécution, test et débogage [3e partie]

Dans cette Journée typique d’un développeur d’intégration de données, nous allons traiter de l’exécution de processus (ou jobs), du test et du débogage dans Talend Studio. La vidéo (et les explications ci-après) explique deux méthodes différentes pour exécuter des jobs, tester des datasets réduits, et utiliser des fonctionnalités de journalisation pour le débogage, ainsi que la fonctionnalité de débogage intégrée à Studio.

Débogage - Méthode 1

Voici un processus simple qui lit les données depuis un fichier volumineux, les agrège et les écrit en sortie dans une table.

capture d’écran talend studio

Accédez à la fonctionnalité Run (Exécuter) de l’onglet, lancez-la et cliquez sur Debug (Déboguer), puis cliquez sur le bouton Next (Suivant) pour créer le job et lancer l’exécution du processus. Vous pouvez voir les données subir chaque transformation, avec tous les attributs.

Le fichier a plusieurs colonnes et le composant tMap les réduit. Je veux à présent réduire le dataset pour ne voir qu’un volume réduit de données.

Si je clique sur le composant pour ce fichier, j’ai une limite de champs que je peux définir sur 10. Si je reviens ensuite à Run, Debug, Run (Exécuter, Déboguer, Exécuter), je peux voir le processus complet avec seulement 10 enregistrements en cliquant dix fois sur le bouton Next (Suivant).

Je vois ensuite les fonctionnalités des attributs de débogage dans tous les composants. Je peux les faire glisser pour les déplacer afin de mieux voir ce qui a été effectivement écrit dans la base de données. Et je peux voir la séquence en cours de création dans le tMap.

Débogage - Méthode 2

Une autre méthode pour déboguer le processus consiste à ajouter la sortie de l’écran dans Studio à l’aide du composant tLogRow, et associer la sortie du dernier tMap dans le tLogRow.

Je ne fais donc que créer une nouvelle ligne de sortie dans le tMap. Si je vais dans le tMap, je peux connecter les attributs que je veux passer au tLogRow dans le tMap, je les glisse/dépose ici :

capture d’écran talend studio

Si vous avez besoin d’ajouter la séquence pour être sûr qu’elle est correctement générée, ajoutez une nouvelle colonne.

capture d’écran talend studio

Nommez-la seq. Comme j’ai besoin d’en faire un entier, je la change en int. Ajoutez ensuite une fonction dans le constructeur d’expression, et ajoutez le numéro de la séquence. J’ai maintenant une séquence prête à l’emploi.

Si je veux voir les données dans un format plus convivial, je peux le faire. Par exemple, si je veux plus de lignes pour voir plus de données, je peux spécifier 100 lignes dans le fichier. Et si je l’exécute en mode standard, je peux alors voir toutes les données affichées à l’écran, agrégées avec leurs numéros de séquence.

Pour plus de détails sur ces deux méthodes de débogage, regardez la vidéo ci-dessus. Dans le prochain tutoriel, vous découvrirez les fonctions de conception de base.

| Last Updated: August 7th, 2019