Série Journée typique d’un développeur d’intégration de données : Fonctionnalités de base de conception de jobs [5e partie]

Dans cette Journée typique d’un développeur d’intégration de données, nous allons nous concentrer sur les fonctionnalités de base de la conception de jobs dans Talend Studio. Le premier point sur lequel nous allons nous pencher concerne les variables de contexte.

Les variables de contexte sont très utiles. Elles peuvent être utilisées globalement ou localement. Les variables de contexte globales peuvent vous aider à rendre votre job plus dynamique, afin de pouvoir le migrer entre les environnements de développement, test ou production.

Penchons-nous donc sur quelques variables de contexte au sein du processus dim load.

J’ai défini quelques variables de contexte globales ici à gauche.

capture d’écran talend studio

Ouvrez la variable de contexte pour connaître le suffixe et le nom de fichier de la base de données. Cette variable de contexte est utilisée par tous les processus de chargement airline, à la fois les tables dim et fact. Je vais définir le suffixe pour la base de données, les noms de fichiers et l’emplacement.

Il y a ici plusieurs configurations.

capture d’écran talend studio

Je peux avoir une configuration pour dev, prod et QA. Je peux donc sélectionner la variable de contexte que je veux utiliser, en fonction de l’environnement que je veux charger. Les variables de contexte font donc partie de la chaîne de connexion et de l’emplacement des fichiers au sein des jobs.

Cela me permet de migrer les jobs sans modifier le code. Je sélectionne simplement une configuration différente pour les paramètres.

Si vous cliquez sur le job lui-même et que vous allez à l’onglet Context, vous verrez où ces variables de contexte ont été importées dans le job. Voici donc les variables de contexte avec le suffixe de base de données et l’emplacement de fichier.

capture d’écran talend studio

Une fois que vous avez sélectionné ou importé ces contextes pour sélectionner une configuration, vous sélectionnez l’icône à droite, en haut, puis ouvrez une liste déroulante et sélectionnez le contexte dev, QA ou prod. Nous allons utiliser dev.

Vous pouvez aussi voir comment sont utilisées ces variables de contexte. Par exemple, cette chaîne de connexion utilise le suffixe db à la fin de airline, donc, selon la configuration que j’utilise, le nom sera airline_dev ou _prod.

Lorsque vous aller exécuter ce processus, il va alors rempli la configuration ou la base de données airline_dev configurée avec les mots de passe dev, que j’ai importés depuis un projet de contexte de référence. Donc, pendant cette exécution, il va terminer et charger mes tables dim airline dev.

Pour plus de détails sur ce processus, regardez la vidéo ci-dessus. Vous allez ensuite apprendre à auto-documenter les jobs d’intégration de données.

| Last Updated: August 7th, 2019