Trier un fichier

Dans ce tutoriel, vous utiliserez un composant de traitement et apprendrez à trier des données dans un fichier.
   
   Ressources :
   Instructions au format PDF, Fichier de données d'exemple, Export de Job
   
   Ce tutoriel utilise Talend Open Studio for Data Integration version 6.

1. Créer un Job

  1. Vérifiez que la perspective Intégration est sélectionnée.
  2. Créez un Job et nommez-le SortCSVFile.

Le Job Designer ouvre un Job vide.

2. Ajouter et configurer un composant tFileInputDelimited

  1. Ajoutez un composant tFileInputDelimited au Job.
  2. Pour configurer le composant tFileInputDelimited_1, dans la vue Composant correspondante, cliquez sur le bouton [...] à côté du champ Nom de fichier. Sélectionnez le fichier sur votre disque local, puis cliquez sur Ouvrir.
  3. Pour décrire la structure du fichier, ouvrez l'assistant Schéma pour tFileInputDelimited_1 et cliquez sur le bouton [...] à côté du champ Modifier le schéma.
  4. Cliquez sur l'icône [+] pour ajouter la première colonne et saisissez les informations pour cette colonne.
  5. Répétez l'étape d pour chaque colonne du fichier CSV et fermez l'assistant Schéma.

3. Trier les données dans votre Job

  1. Ajoutez un composant tSortRow au Job et liez les deux composants.

    Remarque : le composant tSortRow lié hérite du schéma du composant tFileInputDelimited_1, vous n'avez donc pas besoin de le configurer.
    .
  2. Pour afficher le schéma dont hérite le composant tSortRow, dans la vue Composant correspondante, cliquez sur le bouton […] à côté de Modifier le schéma.
  3. Pour créer une règle de tri selon l'année de sortie des films, cliquez sur [+]. Dans la colonne Schéma, cliquez sur releaseYear et précisez l'ordre de tri en cliquant sur desc.
  4. Pour afficher les résultats de la règle de tri, dans le Job Designer, ajoutez un composant tLogRow et liez les composants tSortRow_1 et tLogRow_1.
  5. Pour exécuter le Job, cliquez sur Exécuter dans la vue Exécuter du Job sortCSVFile.

Les films figurant dans le fichier source sont désormais classés par année de sortie.

4. Ajouter une deuxième règle de tri

  1. Pour ajouter une deuxième règle de tri, dans la vue Composant de tSortRow_1, cliquez sur (+) et choisissez title dans la colonne Schéma. Dans la colonne Trier, choisissez alpha.
  2. Pour exécuter le Job, cliquez sur Exécuter dans la vue Exécuter.

Les films sont désormais classés par année de sortie, puis par ordre alphabétique de leur nom pour chaque année.

5. Stocker les résultats du Job dans un fichier

  1. Ajoutez un composant tfileOutputExcel au Job et liez le composant tLogRow_1 à celui-ci.
  2. Pour configurer le composant de sortie, dans la vue Composant correspondante, indiquez le chemin d'accès et le nom du fichier de sortie.
  3. Pour inclure une ligne d'en-tête dans le fichier de sortie, cochez la case Inclure l'en-tête.
  4. Pour exécuter le Job, cliquez sur Exécuter dans la vue Exécuter.
  5. Pour vérifier le fichier moviesSorted.xls, accédez au dossier dans lequel il a été créé et ouvrez-le. Le fichier affiche les données triées.
  6. Pour que les données triées ne s'affichent pas dans la vue Exécuter, cliquez avec le bouton droit sur tLogRow_1 et cliquez sur Désactiver tLogRow.
  7. Pour exécuter le Job, cliquez sur Exécuter dans la vue Exécuter.

Le Job s'exécute à nouveau. Cependant, aucune donnée ne s'affiche dans la vue Exécuter.