Les nouveautés de Talend pour l’été 2017

Exécution de Big Data Integration sur AWS, Azure et Google

 

EN SAVOIR PLUS

Accélération de perspicacité

Talend propose pour l’été 2017 les innovations les plus récentes en matière de Cloud et de Big Data ; vous disposerez ainsi d’une vue à 360° de vos clients sur de multiples plateformes Cloud. Accélérez l’adoption d’AWS, Microsoft Azure et Google Cloud Platform, avec la flexibilité et la portabilité nécessaires pour aisément réutiliser le travail de développement sur l’ensemble du Cloud.

Big Data Integration on Azure
Big Data Integration on Google
First and only to support Cloudera Altus
20X faster bulk loading performance

Accélérez les projets Big Data et d’entreposage de données Azure

 

Déplacez rapidement vos informations et créez de nouveaux pipelines de données Cloud grâce à Talend et Azure. La prise en charge étendue des services de stockage de données, Big Data Azure et NoSQL offre à vos applications d’analyse des possibilités approfondies. Créez facilement des tâches Spark en streaming intégrant données temps réel et historiques avec HDInsight, Cosmos DB, Data Lake Store, Table Storage, Blob Storage, Queue Storage et SQL Data Warehouse.

Créez de solides pipelines Big Data sur Google Cloud

La plateforme Google Cloud, associée à Talend qui prend en charge Google BigQuery, Dataproc, Cloud Storage et Pub/Sub, permet aux entreprises de créer rapidement des lacs de données Cloud, d’exécuter un entreposage de données Cloud haute performance et de pouvoir prendre des décisions en temps réel. À l’aide d’outils graphiques, créez des pipelines de données Cloud capables d’ingérer, de traiter, d’enrichir et de nettoyer les données avec la rapidité de Spark.

Déployez aisément des projets Big Data dans Cloudera Altus

 

Dans le Cloud, les Big Data bénéficient d’une agilité incomparable. La nouvelle offre Big-Data-as-a-Service de Cloudera simplifie et accélère l’exploitation des Big Data tout en réduisant les coûts de gestion des données. Avec Talend et Cloudera Altus, vous pouvez lancer un cluster temporaire Hadoop et Spark dans le Cloud, spécifier la capacité requise en termes de nœuds et exécuter la tâche Talend d’un simple clic. Inutile de se préoccuper de DevOps ou du provisionnement, l’intégralité de la gestion serveur est effectuée par Cloudera Altus. Disponible en tant que version d’évaluation technique.

Créez rapidement un lac de données Cloud avec Talend et Snowflake

Entrepôt de données Cloud SQL majeur, Snowflake sait mener de manière rapide et rentable les charges de travail d’analyse exigeantes. Talend assure le chargement en masse le plus rapide dans Snowflake : une performance 20 fois plus élevée que les versions précédentes. Grâce à ses outils ETL visuels et de gestion de la qualité des données, Talend réduit considérablement le délai de migration des bases de données locales et Cloud vers Snowflake.

Autres mises à jour

Big Data Integration

Améliorez la performance et la productivité de vos projets Big Data :

  • Rationalisation des processus DevOps pour Hadoop en définissant des configurations personnalisées de clusters pour les environnements de développement, de test et de production.

  • Exécution des requêtes SparkSQL beaucoup plus rapide grâce à la prise en charge de Spark 2.1.

  • Innovation plus rapide grâce à la prise en charge des distributions Big Data les plus récentes.

Data Integration

Améliorez votre productivité et la sécurité de vos projets :

  • Plus grande flexibilité en termes de gestion et de sécurité grâce aux mises à jour TAC Talend (Talend Administrator Center) : création de rôles personnalisés, séparation des rôles de sécurité et d’administrateur TAC, authentification unique (SSO).

  • Les mises à jour d’intégration continue incluent la prise en charge AWS CodeCommit (Git) et la possibilité de créer des versions de chaque tâche (par identifiant de groupe, d’artefact, déploiement).

  • Amélioration des filtres tMap et des assistants Studio pour simplifier la recherche dans les grands schémas.

  • Sécurité renforcée grâce aux mises à jour IAM Talend (Identity Access Management).

  • Nouveau connecteur SDK permettant de créer un composant unique pour plusieurs styles d’intégration (version d’évaluation technique).

  • Nouveau composant JDBC Slowly Changing Dimension (tJDBCSCD) avec prise en charge ELT.

Data Preparation

Offrez une expérience utilisateur optimale en préparation des données, même à très grande échelle :

  • Simplicité d’accès, de nettoyage, de correction et de format des données Salesforce grâce à un connecteur Salesforce en libre-service.

  • Simplicité d’accès, de nettoyage, de correction, de format et de stockage de toute préparation ou de tout ensemble de données sur Amazon S3 grâce à un connecteur Amazon S3 sécurisé.

  • Suivi des modifications et utilisation aisée des préparations des utilisateurs grâce aux versions.

  • Prise en charge des normes de gestion des projets via l’utilisation simplifiée des préparations de données dans des environnements de production et de non production.

  • Exécution des préparations Big Data sur des données en streaming pour obtenir une vision en temps réel, avec prise en charge Spark Streaming (tDataPrepRun dans Talend Real-Time Big Data).

  • Migration facile, d’un simple clic : toutes les préparations et les ensembles de données passent de Data Preparation Free Desktop à la version commerciale.

  • Gain de temps avec l’authentification unique pour Data Stewardship et Data Preparation.

Talend Data Mapper

Améliorez la performance de vos mappings complexes :

  • Des résultats plus rapides grâce à Spark 2.1.

  • Enregistrements hiérarchiques avec Spark Streaming (tHMapRecord).

  • Meilleure gestion des structures SAP IDoc.

  • Amélioration de la signature de documents pour Spark Batch.

Data Quality

Améliorez l’intégrité des données tandis qu’elles circulent dans l’entreprise :

  • Service de dictionnaire avancé avec prise en charge de types de sémantiques composés ainsi que des types de sémantiques des États nord-américains et des numéros de téléphones internationaux.

  • Performance améliorée via l’appariement des nouveaux enregistrements uniquement avec l’ensemble de données initial (appariement Spark continu).

  • Survivance ajustée grâce à la prise en charge de règles de survivance complexes et en cascade.

  • Extraction automatique d’informations des données non structurées via NLP (Natural Language Processing).

Data Stewardship

Accélérez la curation des données grâce à Data Stewardship :

  • Productivité de déduplication améliorée avec la nouvelle interface utilisateur pour l’apprentissage machine Spark et correspondance des campagnes de groupes.

  • Optimisation des performances en appliquant un appariement plus intelligent et plus complexe (intégré à MDM).

  • Anticipation de l’impact des modifications du modèle de données via une analyse améliorée de cet impact.

  • Meilleures fonctionnalités de détection automatique grâce au service de dictionnaire avancé avec prise en charge de types de sémantiques composés ainsi que des types de sémantiques des États nord-américains et des numéros de téléphones internationaux.

MDM

Accélérez la conception, l’ingestion, la création, la curation et la mise à jour de vos données de référence :

  • Performance accélérée grâce aux améliorations apportées aux opérations de lecture/écriture et aux clusters.

  • Appariement intégré et survivance native avec règles plus intelligentes et possibilité de déléguer le stewardship à quasiment tous les utilisateurs via l’application Data Stewardship.

  • Analyse d’impact plus intelligente et plus flexible pour faciliter la gestion des modifications.

Les nouveautés en gouvernance des données

ESB

Améliorez votre productivité ESB et la sécurité de vos projets :

  • Rationalisation des efforts de développement grâce à l’environnement d’exécution de test ESB fourni avec Studio. Débogage des services de données et des routes depuis Studio dans l’environnement d’exécution Talend.

  • Utilisation des normes de sécurité les plus récentes lors de l’intégration aux applications mobiles ou natives via des API REST avancées.

  • Amélioration de la sécurité des services de données via des mises à jour Talend Identity Access Management avec OpenID Connect, SAML, OAuth.

  • Amélioration de la productivité via partage de jars personnalisés avec les membres de l’équipe (cConfig).

Talend Metadata Manager

Obtenez une vue globale des métadonnées dans le lac de données :

  • Collecte et intégration des métadonnées des systèmes Cloud et Big Data aux nouveaux connecteurs de métadonnées pour S3, Hadoop HDFS, Hive, MongoDB, Couchbase, Cassandra et Apache Atlas.

  • Analyse avancée de scripts avec prise en charge des formats BTEK, SQL et PL/SQL.

  • Création d’un inventaire pour le lac de données par récolte automatique des structures de données dans les systèmes de fichiers (S3, Hadoop HDFS, Posix, Windows et Linux) et les formats de fichiers (CSV, Excel, JSON, Avro et Parquet).

  • Les utilisateurs métier peuvent s’abonner aux alertes et aux modifications des métadonnées via des notifications. Les rôles de stewardship peuvent être attribués à n’importe quel utilisateur ; ils recevront une notification lors de la récolte de nouveau contenu, avec analyse d’impact des modifications.

Étendez la portée de l’intégration

Talend Studio comporte plus de 900 composants et connecteurs d’applications métier. Vous pouvez consulter la liste complète à la page Talendforge.org.
 

 

Nouvelles distributions Hadoop et mises à jour

Amazon EMR 5.5/5.6 | Cloudera CDH 5.10.1 | Google Dataproc 1.1 | Hortonworks HDP 2.6 | Microsoft Azure HDInsight 3.6 | Spark 2.1

Nouveaux composants et mises à jour

Exasol | Excel | Google Cloud Dataproc, Google Cloud Storage, Google Cloud Pub/Sub, Google BigQuery | MapR-DB, MapR-Streams | Marketo | Microsoft Azure Table Storage, Azure Blob Storage, Azure Queue Storage, Azure Data Lake Store, Azure SQL Data Warehouse, Azure Cosmos DB, Microsoft Dynamics CRM (365/2016) | Netsuite | Salesforce | SAP | Snowflake | Sybase

 

© 2017 Talend All rights reserved.

X