Talend aide les entreprises à accélérer le déploiement de leur data lake dans le cloud sur AWS

La nouvelle solution Quick Start aide les clients à déployer et à alimenter en quelques clics des datas lakes d'entreprise dans le cloud

REDWOOD CITY, Calif. - 21 novembre 2017 -

Talend (NASDAQ: TLND), a global leader in cloud and big data integration solutions, unveiled a new Quick Start solution for deploying cloud data lakes on Amazon Web Services (AWS) platforms. The comprehensive, out-of-the-box offering is ideal for organizations looking to get data lakes up and running quickly, while leveraging the speed, agility, scalability, and power of the cloud. Available for download immediately, the Quick Start  automates the building of data lake environments by deploying Talend Big Data Integration components and AWS services such as Amazon EMR, Amazon Redshift, Amazon Simple Storage Service (Amazon S3), and Amazon Relational Database Service (Amazon RDS).

Selon Gartner, « les utilisateurs souhaitent analyser plus rapidement qu’auparavant des combinaisons de sources et de modèles de données diversifiées, souvent plus volumineux et plus complexes. La capacité de préparer, de nettoyer, d’enrichir et de trouver rapidement des jeux de données fiables, de manière plus automatisée devient un élément important pour élargir les modes d'utilisation. » [1]

Les entreprises qui cherchent à tirer parti de la puissance des données pour transformer leurs activités se tournent de plus en plus vers les data lakes dans le cloud. Cette infrastructure leur permet de collecter et analyser des volumes considérables de données structurées, semi-structurées et non structurées pour en dégager des informations pertinentes pour l’entreprise. En collectant et stockant tous les types de données en provenance d'une multitude de sources – de l'activité des sites web aux réseaux sociaux en passant par l’Internet des objets et les données historiques –, les data lakes dans le cloud permettent de surmonter la plupart des défis complexes et les lenteurs rencontrés sur les systèmes traditionnels plus rigides. La combinaison de technologies d'intégration des big data et d'analytique permet aux entreprises d’ingérer et de traiter des volumes énormes d’informations variées, avec plus de rapidité et de flexibilité, réduisant ainsi considérablement le temps nécessaire à la compréhension et à la valorisation de cette information.

« La transformation digitale est en train de bouleverser tous les secteurs d’activité. La capacité à extraire des informations pertinentes de volumes de plus en plus conséquents de big data en est un facteur clé », explique Mike Pickett, vice-président du développement et des écosystèmes de partenaires de Talend. « Les entreprises qui ne parviennent pas à concevoir un moyen efficace pour généraliser l'exploitation des données dans leurs activités seront rapidement dépassées par des acteurs plus agiles. Grâce à sa flexibilité, son évolutivité et ses performances inégalées, le cloud est la plateforme de choix pour les entreprises qui cherchent à tirer le meilleur parti de leur data lake pour améliorer leur compétitivité et leurs relations clients. »

La nouvelle solution Data Lake de Talend intègre les fonctionnalités suivantes :

  • Une architecture de référence automatisée par le modèle AWS CloudFormation, qui intègre des services AWS tels que Amazon Simple Storage Service (Amazon S3), Amazon Elastic Compute Cloud (Amazon EC2) et Amazon Redshift.
  • La plateforme Talend Big Data Integration, qui inclut des connecteurs et des composants pour la connexion à plus d’un millier de sources de données et d’applications, dont Salesforce, les applications et bases de données historiques, les services web SOAP ou REST, ainsi que les protocoles de streaming de données tels que Kafka. Cette plateforme minimise les besoins en codage manuel, et peut exécuter Spark ou MapReduce en natif sur Amazon EMR.
  • Des modèles (Talend Quick Start CloudFormation) pour les environnements de développement, de test et de production.

Avec cette solution complète et prête à l'emploi, les entreprises peuvent disposer de connaissances pertinentes, en quelques semaines ou quelques mois, grâce à la performance des services d'analyse AWS tels que Amazon QuickSight et Amazon Machine Learning (Amazon ML).

Beachbody, fournisseur international de programmes de remise en forme, de nutrition et de perte de poids, a déployé en moins de six mois une architecture data lake pour son système analytique en libre-service en utilisant Amazon S3 et Talend Real-time Big Data. Résultat, l'équipe informatique de Beachbody a fait passer la fréquence de réception de nouvelles données d'une fois par semaine au quasi-temps réel, ce qui permet à ses employés de prendre des décisions plus rapidement. Aujourd'hui, les employés de Beachbody ont accès à un patrimoine de données beaucoup plus large et complet : données d’activité du site web, historiques des streaming des vidéos d'entrainements, enregistrements du centre d'appels, l’acquisition de nouveaux clients, les dépenses, les informations sur les ventes et les données de transactions financières.

« L'agilité et la flexibilité incomparables d'AWS et les capacités d'intégration aisées de Talend ont changé la donne. Avec nos ressources limitées, non seulement ce projet aurait été infiniment plus difficile, plus coûteux et plus long, et j'aurais dû embaucher beaucoup plus de personnes compétentes en gestion des big data », reconnaît Eric Anderson, directeur des données chez Beachbody. « Alors qu'un lancement sur site nous aurait pris plus d'un an, nous avons pu disposer d'une solution opérationnelle en seulement six mois, ce qui a permis à nos analystes et à nos employés d'avoir accès à un nombre croissant de sources de données. Aujourd'hui, le potentiel d'évolution de l'entreprise par l'exploitation de différentes formes de données et de connaissances est pratiquement illimité. »

Les avantages de la solution de data lake Quick Start sur AWS sont notamment les suivants :

  • Offrir de la valeur ajoutée plus rapidement grâce aux sources de données préconfigurées et aux meilleures pratiques de DevOps, pour une intégration rapide des données et une automatisation de l'assurance qualité.
  • Être opérationnel sur AWS en quelques minutes et évaluer la solution en quelques jours.
  • Réduire la courbe d’apprentissage et augmenter la productivité à l'aide des innovations de Talend (outils graphiques, connecteurs et composants natifs, outils de gestion des données en libre-service).

Pour en savoir plus sur l’ensemble des fonctionnalités de la solution Talend Quick Start pour AWS, visionnez ce webinar (intitulé « Architecting and Open Data Lake for the Enterprise ») ou visitez : www.talend.com/cloud-data-lakes. Des informations complémentaires sur les avantages des data lakes, ainsi que sur les meilleurs pratiques de développement, sont disponible sur le blog Talend.

Vous aimez cette histoire ? Partagez-la sur Twitter : La nouvelle solution @Talend @AWSCloud Quick Start pour le déploiement de data lake accélère le délai de traitement des données - http://bit.ly/1L7jEVV

 

[1] Gartner, "Magic Quadrant for Business Intelligence and Analytics Platforms," Rita Sallam, Cindi Howson, Carlie J. Idoine, Thomas W. Oestreich, James Laurence Richardson, Joao Tapadinhas, February 2017.