Talend annonce la première solution de préparation de données pour le Big Data sur Apache Beam

Cette solution permet aux entreprises de délivrer un service de préparation de données pérenne à leurs utilisateurs, quelle que soit la plateforme utilisée
REDWOOD CITY, Calif.

Talend (NASDAQ : TLND), leader mondial des solutions d’intégration big data et cloud, annonce la première solution de préparation de données pour le big data en libre-service, sur Apache Beam. Devenu un projet de premier plan de la fondation Apache, Apache Beam est un modèle de programmation unifié qui permet d’exécuter des pipelines de flux de données par lots (batch) ou en flux continu (streaming), avec la possibilité de les exécuter sur une variété de plateformes. Talend Data Preparation est une solution en libre-service permettant à davantage d’employés d’accéder, de nettoyer et d’analyser d’important jeux de données. La combinaison Apache Beam et Talend Data Preparation est conçue pour aider les entreprises à accélérer la prise de décision, en permettant à un plus grand nombre d’utilisateurs de créer des projets de données qui peuvent être exécutés sur l’ensemble des dernières innovations technologiques liées au traitement de données.

« Aujourd’hui, les entreprises doivent pouvoir accéder plus facilement à des données propres et utilisables, afin de générer des informations qualifiées en temps réel au sein de leur organisation », déclare Laurent Bride, directeur technique de Talend. « Cependant, l’innovation technologique étant de plus en plus soutenue, les responsables informatiques doivent souvent faire face au risque que leurs investissements deviennent rapidement obsolètes, voire même qu’ils fassent obstacle à la croissance future de leur entreprise. Nous sommes convaincus qu’Apache Beam représente l’avenir : ce modèle évite d’avoir à réécrire des applications au gré des innovations, de migration de systèmes vers le cloud ou en cas d’alternance de styles d’intégration. L'utilisation de Beam pour Data Preparation permettra à nos clients de créer une seule fois leurs modèles de préparation de données et de les exécuter n’importe où, bénéficiant ainsi d’une agilité sans précédent. »

La solution Talend Data Preparation sur Apache Beam a été introduite en janvier dans la version Winter‘17 de la plateforme d’intégration de Talend. Elle témoigne de l’engagement constant de Talend envers cette technologie révolutionnaire de traitement de données. Depuis 2015, Talend participe au développement d’Apache Beam au côté de Google et d’autres partenaires, et a apporté au cours de ces deux dernières années de nombreuses contributions à la communauté Beam. Apache Beam devrait même devenir un des éléments clé de la couche technique d’intégration de Talend Data Fabric.

Responsabiliser les employés avec des données qualifiées et de confiance

La préparation de données en libre-service permet aux utilisateurs métiers d’intégrer de précieuses informations sur leurs clients, fournisseurs, produits et partenaires à leurs flux de travail quotidiens, afin de s’adapter plus rapidement à l’évolution de leurs besoins et des marchés. Selon Gartner, « l’incapacité des leaders de la business intelligence à adopter la préparation de données en libre-service, rend les entreprises plus lentes à réagir face à un désavantage concurrentiel de par l'impossibilité d'exploiter pleinement des sources de données pertinentes. »[1]

Transformer les données en prise de décision est un travail d’équipe. Ainsi, les entreprises doivent changer fondamentalement la façon dont elles permettent l’accès et le partage aux données au sein de leur organisation pour orchestrer une collaboration des données, si elles souhaitent évoluer dans leurs efforts de digitalisation. Grâce à la version Winter’17 de Talend Data Fabric, le département informatique donne aux utilisateurs métiers le pouvoir d'accéder et d'accélérer la préparation et le nettoyage des données pour profiter pleinement des data lakes de l'entreprise. Les capacités de préparation des données de Talend permettent aux clients de :

  • Accéder à n'importe quelle source de données, qu'elle soit hébergée dans Hadoop, sur le cloud ou dans des bases de données traditionnelles, puis de les partager entre utilisateurs et groupes de travail pour encourager la collaboration.
  • Utiliser un dictionnaire de données préconfiguré pour reconnaitre automatiquement la signification de données brutes d’un data lake, ainsi que d’enrichir ce dictionnaire avec son propre vocabulaire, tel que les codes ou noms de produits de l’entreprise.
  • Décrire de nouvelles données de manière participative depuis des données ouvertes (open data) et/ou la communauté Talend.

Pour de plus amples renseignements sur Talend Data Preparation sur Apache Beam ou sur l’ensemble des fonctionnalités et avantages de Talend Winter’17, visitez www.talend.com/products/talend-6/. Pour plus d’informations sur Apache Beam et sur l’implication de Talend dans ce projet, rendez-vous sur notre blog.

Vous aimez cette histoire ? Partagez-la sur Twitter : Des projets #BigData pérennes avec la première solution de #DataPreparation sur #ApacheBeam bit.ly/1L7jEVV



[1] « Embrace Self-Service Data Preparation Tools for Agility, but Govern to Avoid Data Chaos », par Cindi Howson, Gartner Research, mai 2016.