Les nouveautés de Talend pour le printemps 2019

Talend Cloud : encore amélioré avec Pipeline Designer.

L’intégration des données réinventée

Les conditions de l’intégration des données ont beaucoup évolué, posant de nouveaux défis aux entreprises. Talend vous aide à rationaliser et développer la collecte, le traitement et la gestion des données pour la croissance future.

Points forts de Talend Cloud avec le nouveau Pipeline Designer :

Développez plus vite, plus facilement et plus intelligemment

Intégrez toutes vos données à la vitesse de votre choix

Innovez et évoluez sans effort

Trusted Sources Infographic

Réinventer l’intégration des données pour le traitement moderne des données

Pipeline Designer est un environnement de conception d’intégration de données de nouvelle génération qui permet aux développeurs de développer et déployer des pipelines de données beaucoup plus vite, de réaliser des conceptions de manière fluide sur des scénarios en batch et en streaming, tout en évoluant en mode natif avec les dernières technologies hybrides et multi-cloud.

En savoir plus

Augmentez vos capacités d’intégration des données

Découvrez les nombreuses nouvelles fonctionnalités de tous les produits lors des Nouveautés Talend pour l’Automne '18. Pour en savoir plus sur les spécifications, les composants et les connecteurs de chaque version et produit, visitez https://help.talend.com/.

Cloud Data Integration
Cloud API Designer
Data Quality
Cloud Data Preparation
Cloud Data Stewardship
Cloud Management Console
Talend Cloud Data Integration
  • Présentation de Pipeline Designer (auparavant appelé Talend Data Streams), nouvel environnement de conception d’intégration de données.
  • Avec Pipeline Designer, vous pourrez :
    • Convertir des données d’entreprise pour les analyser (p. ex. : Salesforce vers Redshift) 
    • Déplacer des données d’un data lake vers un entrepôt (p. ex. : S3 vers Redshift, Snowflake)  
    • Importer et convertir des données de streaming vers un data lake cloud (p. ex. : Kafka vers S3)
    • Déplacer des données sur site vers le cloud (p. ex. : SQL Server vers Azure SQL Database)
    • Réaliser des traitements de données légers (conception dans le cloud, connexion aux sources cloud et sur site, exécution dans le cloud ou sur site)
  • Vue d’ensemble :
    • Utilisez un concepteur graphique Web pour créer des pipelines de bout en bout et ainsi prévisualiser et transformer vos données
    • Transformations légères avec processeurs intégrés, notamment : filtrage, regroupement, aplatissement, réplication, recherche, participation et fenêtrage de temps
    • Augmentez les capacités des processeurs de pipelines par le biais d’une prise en charge du codage Python, pour une plus grande flexibilité
    • Conçu pour les formats de données les plus récents, notamment : AVRO, JSON, Parquet, CSV...
    • Concevez de manière fluide dans des scénarios en mode batch ou streaming à l’aide d’une seule interface
    • Traitez facilement les données sans configuration supplémentaire grâce au Cloud Engine intégré
    • Concevez des pipelines dans le cloud, puis exécutez-les sur site, dans AWS EMR, ou dans un cloud privé virtuel
    • Avec la fonctionnalité schema-on-read, il devient inutile de définir des schémas avant la création de pipelines. De plus, elle rend les pipelines plus résilients lors de l’évolution des schémas.
    • Observez l’évolution instantanée des données interactives grâce aux aperçus en direct d’échantillons de données
    • Utilisez un service de données partagé, commun (référentiel) sur tous les produits Talend, pour permettre le travail d’équipe, le partage et la réutilisation des données
  • Connectivité :
    • Fonctionnalité de lecture/écriture pour Snowflake, Amazon Redshift, Azure SQL Database, Amazon RDS (Oracle, SQL Server, MySQL, MariaDB, PostgreSQL, Aurora), et sur site via JDBC (Oracle, SQL Server, MySQL, MariaDB, PostgreSQL)
    • Connecteurs natifs d’entrepôt de données cloud : Chargeurs de données en masse Snowflake et Amazon Redshift (destination seulement), Google BigQuery
    • NoSQL : Elasticsearch
    • Stockage cloud : Amazon S3
    • SaaS : Salesforce
    • Files d’attente de messages en streaming : Apache Kafka et Amazon Kinesis
  • Administration :
    • Gérez les utilisateurs et les licences avec Talend Management Console
    • Planifiez des tâches et surveillez leur état avec Talend Management Console
Talend Cloud API Designer
  • Importez et exportez des définitions d’API dans OpenAPI Specification v3.0, pour garantir la compatibilité avec les outils API tiers
  • Importez facilement vos définitions API dans Amazon API Gateway et Azure API Management via un mode d’exportation dédié dans API Designer
  • Améliorations de la conception d’API pour une meilleure expressivité et productivité des développeurs, notamment :
    • Composition de type de données (allOf), p. ex. en fusionnant différentes données de client (comme le profil, le contact, les préférences) en une vue de client unifiée
    • Polymorphisme de type de données (anyOf, oneOf), p. ex. en acceptant soit « chien », soit « chat » en entrée
    • Possibilité de documenter les nouveaux mécanismes de sécurité tels qu’OpenID Connect ou JWT
    • Composants API réutilisables, par exemple pour créer un composant qui décrit comment paginer les résultats et les utiliser dans l’API. Un simple changement suffit pour le modifier.
    • Plages de réponse et d’état par défaut, par exemple pour « toute erreur » dans cette opération, cette « réponse particulière » sera renvoyée
Data Quality
  • Auditez toutes les actions des utilisateurs dans le Dictionary Service y compris en matière de connexion, déconnexion, mises à jour de la configuration et déploiements (version on-premises uniquement).
  • Découvrez de nouveaux patterns, par exemple pour détecter des valeurs aberrantes, grâce à l'amélioration du profiling et au support des patterns basés sur des mots.
  • Importez et exportez plusieurs types sémantiques à la fois dans le dictionnaire pour améliorer la productivité.
  • Récupérez les numéros de téléphone internationaux à l'aide du composant tGoogleAddressRow.
  • Le support des bases de données Denodo complète les options de connectivité pour le profiling des données.
  • La version japonaise inclut de nouvelles fonctions de reconnaissance de données, de masquage et de standardisation des données
  • Talend Data Quality est désormais disponible en chinois
Talend Cloud Data Preparation
  • Utilisez un service de données partagé, commun (référentiel) sur tous les produits Talend, pour permettre le travail d’équipe, le partage et la réutilisation des données Connectivité en self-service et prise en charge des formats hiérarchiques avec lissage automatique.
  • Efficacité améliorée du nettoyage et de la normalisation des bases de données :
  • Application des fonctions sur plusieurs colonnes, p. ex. concaténation et opérations mathématiques
  • Extraction intelligente d’une partie d’un nom dans la sous-partie correspondante (titre, prénom, nom, suffixe)
  • Extraction des parties d’un champ en fonction d’une définition de types sémantiques, c.-à-d.. la capacité à diviser un champ composé de plusieurs parties en sous-parties correspondantes
  • Protection des données améliorée, avec capacité à réaliser le masquage de données sémantiques sur des types sémantiques composés
Talend Cloud Data Stewardship
  • Notifiez les data stewards et propriétaires de campagne par mail lors de l’affectation ou l’expiration de tâches, pour améliorer la réactivité
  • Ajoutez des commentaires et fils de discussion à des tâches et attributs de tâches pour améliorer le travail en équipe
Talend Cloud Management Console
  • Déployez des services automatisés pour un DevOps plus efficace et souple, via une API Talend Management Console
  • Testez facilement les fonctions API dans Talend Cloud en utilisant un exemple d’artefact d’API REST dans Talend Management Console (TMC)
  • Créez un token personnel pour l’authentification et la connectivité entre Studio et Talend Cloud, à la place de la combinaison nom d’utilisateur/mot de passe
  • Regroupez et recherchez des tâches TMC à l’aide de balises pour une meilleure organisation
  • Pipeline Designer : gérez et supervisez les artefacts, les moteurs cloud et distants, les profils d’exécution

Essayer

Augmentez vos capacités d'intégration des données

Pour plus de détails sur les spécifications, composants et connecteurs de chaque version et produit, visitez : https://help.talend.com/.

Distributions Hadoop (nouvelles et mises à jour)

  • Amazon EMR 5.15
  • Cloudera CDH 6.0
  • Hortonworks 2.6x
  • MapR 6.0.1 with MEP 5.0
  • Databricks 3.5 LTS
  • Qubole Data Services 1.0
  • Spark 2.3

Produits nouveaux ou mis à jour

  • Couchbase
  • Google BigQuery
  • Greenplum
  • MapR-DB OJAI
  • MariaDB
  • MarkLogic
  • MySQL
  • Oracle ADW
  • PostgreSQL
  • Salesforce
  • SAP HANA
  • Snowflake