Big Data (BD) Enterprise

Talend fournit un environnement de développement permettant les interactions avec les sources et cibles Big Data, sans nécessité d'apprendre ou d'écrire du code compliqué. Talend Big Data s'exécute 100 % en natif sur Hadoop et est grandement évolutif.

La formation Talend Big Data Enterprise suit la formation Talend Big Data Hadoop Components et est dédiée aux Jobs MapReduce. Vous allez découvrir et utiliser les fonctionnalités associées au logiciel Talend Big Data Enterprise, comme les variables de contexte, les métadonnées, l'aperçu des données et le Job Designer MapReduce.

Durée 2 jours
Public ciblé Les personnes souhaitant créer des Jobs MapReduce à l'aide du studio Talend Big Data Enterprise
Prérequis Avoir suivi les formations DI Basics et BD Hadoop Components
Objectifs de la formation
A la fin de ce cours, vous pourrez :
  • Développer et exécuter des Jobs MapReduce
  • Convertir un Job standard en un Job MapReduce
  • Se connecter à un cluster Hadoop
  • Créer les métadonnées pour votre connexion au cluster Hadoop
  • Configurer les variables de contexte
  • Récupérer le schéma d'un fichier à l'aide d'un assistant Talend
  • Envoyer des données dans Hadoop HDFS
  • Charger différents fichiers dans HDFS
  • Vérifier les données avec l'aperçu des données
  • Lire et écrire des tables HBase
  • Ecrire des données dans un fichier HTML
  • Utiliser l'API Twitter
  • Trier et agréger des données à l'aide de composants MapReduce
  • Filtrer des données à l'aide de composants MapReduce
  • Effectuer des jointures sur les tables
Programme de la formation
  • Cas d'usage : Apache Weblogs
  • Cas d'usage : données météorologiques
  • Cas d'usage : analyse des sentiments
  • Cas d'usage : flux de clics