Talend Big Data Basics

Cette formation Talend fournit aux participants un environnement de développement complet, qui leur permettra d'interagir avec une architecture Big Data, sans avoir besoin de comprendre ou d'écrire de code complexe.

La formation Talend Big Data Basics est une introduction aux composants Talend fournis avec les logiciels de la gamme Big Data.

Durée1 jour (7 heures)
PublicDéveloppeur souhaitant utiliser Talend Studio pour interagir et exploiter les systèmes Big Data
PrérequisAvoir suivi les formations Talend Data Integration Basics ou Talend Data Integration Advanced
Objectifs de la formation
À l’issue de cette formation, vous pourrez:
 
  • Créer des métadonnées de cluster manuellement, à partir de fichiers de configuration ou via une détection automatique des paramètres
  • Créer des métadonnées HDFS et Hive
  • Vous connecter à votre cluster pour utiliser HDFS, HBase, Hive, Pig, Sqoop et MapReduce
  • Lire et écrire des données sur HDFS (HDFS, HBase)
  • Lire et écrire des données sur HDFS (Hive, Sqoop)
  • Traiter des données stockées sur HDFS avec Hive
  • Traiter des données stockées sur HDFS avec Pig
  • Traiter des données stockées sur HDFS avec des Jobs batch Big Data
Programme de la formationConcepts de base 
  • Ouvir un projet
  • Contrôle du cluster Hadoop
  • Création de métadonnées du cluster
Lire et écrire des données sur HDFS
  • Stocker un fichier sur HDFS
  • Stocker des fichiers multiples sur HDFS
  • Lire des données sur HDFS
  • Utiliser HBase pour stocker des données éparses sur HDFS
Travailler avec des tables
  • Importer des tables avec Sqoop
  • Créer des tables dans HDFS avec Hive
Traiter des données et des tables sur HDFS
  • Traiter des tables Hive avec les Jobs
  • Lancer un profiling des tables Hive (optionnel)
  • Traiter des données avec Pig
  • Traiter des données avec les Jobs batch