Lancement de la Winter ‘17 de Talend Data Fabric pour accélérer la prise de décisions

La plateforme d'intégration de données dispose de nouvelles fonctionnalités de préparation et de gouvernance des données en libre service afin de transformer les data lakes en données qualifiées, propres et utilisables par tous
REDWOOD CITY, Calif.

Talend (NASDAQ: TLND), leader mondial des solutions d'intégration Big Data et Cloud, annonce la nouvelle version Winter’17 de Talend Data Fabric, une plateforme puissante qui facilite la collaboration entre l'informatique et les utilisateurs métiers afin de mieux utiliser les données pour la prise de décisions. La plateforme intégrée de Talend inclut désormais de nouvelles fonctionnalités de préparation des données pour le big data, permettant à tous les employés d'accéder, de nettoyer et de collaborer à l'analyse des données de leur data lake, ainsi qu'une application intuitive de gestion des données en libre-service, Data Stewardship, qui aide les entreprises à se prémunir des risques et pénalités découlant des problématiques d'intégrité des données. Cette dernière version de Talend Data Fabric inclut également les innovations Spark 2.0 pour Talend Big Data et Talend Integration Cloud qui permettent aux clients d'accélérer les processus métiers et de maintenir  en permanence leurs environnements au niveau  des dernières évolutions technologiques.

Une étude Gartner indique que « En 2018, 90 % des data lakes déployés seront devenus inutilisables car ils seront submergés par un trop-plein d’informations capté pour des cas d'utilisation incertains »[1]. Bien que les data lakes présentent de nombreux avantages et qu’ils se mettent au service de la transformation numérique des entreprises, ils présentent également de nouveaux défis en termes de gouvernance, de qualité et de lignage des données, ainsi que d’accessibilité.

« Les entreprises doivent repenser la manière dont elles utilisent et partagent les données au sein de leur organisation afin d’anticiper leurs efforts de digitalisation. Un data lake, qu'il soit hébergé sur Hadoop, sur site ou dans un cloud, permettant de rassembler dans un répertoire centralisé un capital d’informations bien plus vaste et varié à un coût bien moins élevé, puis de tirer profit de ces informations clés », affirme Ashley Stirrup, directeur marketing de Talend. « La nouvelle version de Talend Data Fabric propulse les clients à la prochaine étape de leur évolution numérique en favorisant la collaboration entre le département informatique et les utilisateurs métiers pour plus d’élasticité et de transformer leurs data lakes en données qualifiées et fiables dont les employés peuvent profiter comme bon leur semble pour prendre des décisions plus éclairées et plus rapidement. »

Data Preparation pour les Big Data

Grâce à la dernière version de Talend Data Fabric, le département informatique donne aux utilisateurs métiers le pouvoir d'accéder et d'accélérer la préparation et le nettoyage des données pour profiter pleinement des data lakes de l'entreprise. Les nouvelles capacités de préparation des données de Talend Big Data permettent aux clients de :

  • Accéder à n'importe quelle source de données, qu'elle soit hébergée dans Hadoop, sur le cloud ou dans des bases de données traditionnelles, puis de les partager entre utilisateurs et groupes de travail pour encourager la collaboration.
  • Effectuer des préparations élastiques, indépendamment des volumes à traiter, en faisant appel à la puissance de Spark 2.0 et Hadoop.
  • Utiliser un dictionnaire de données préconfiguré pour reconnaitre automatiquement la signification de données brutes d’un data lake, ainsi que d’enrichir ce dictionnaire avec son propre vocabulaire, tel que les codes ou noms de produits de l’entreprise.
  • Décrire de nouvelles données de manière participative depuis des données ouvertes (open data) et/ou la communauté Talend.

Data Stewardship : bénéficier de données fiables et propres

Sur un marché de plus en plus concurrentiel comme celui d'aujourd'hui, ce qui fait la véritable différence entre les leaders numériques et les retardataires est la manière dont elles utilisent leurs données. La nouvelle application de Talend, Data Stewardship, est un des premiers outils en libre-service qui permet aux départements informatiques et aux utilisateurs métiers d'intégrer et de gérer efficacement les données tout au long de leur cycle de vie. Grâce à ce composant, les utilisateurs peuvent résoudre rapidement les nombreux problèmes d'intégrité des données et s'assurer que les données du data lake sont de bonne qualité et certifiées conformes. Cette nouvelle application peut aider les entreprises à assurer une meilleure conformité des données pour éviter les amendes onéreuses pouvant découler d'un non-respect des réglementations de conformité tels que la General Data Protection Regulation (GDPR) ou Sarbanes-Oxley. En étendant les tâches de gouvernance des données à des utilisateurs métiers référents déjà familiarisés avec celles-ci, cette nouvelle application donne naissance à un environnement collaboratif, où les données du data lake sont « fiables » et donc plus largement utilisables.

En utilisant l'application Data Stewardship, les employés peuvent inclure la gouvernance dans n'importe quel flux d'intégration de données et isoler des sous-ensembles de données nécessitant une correction, un arbitrage ou une certification humaine. L'application organise ensuite ces tâches en workflow, les attribue à l’utilisateur métier le plus à même d'effectuer le contrôle de qualité et définit les règles selon lesquelles les données doivent être nettoyées et validées. En outre, la nouvelle version de Talend Data Fabric fait appel au machine learning (apprentissage automatique) afin de découvrir les meilleures pratiques de conservation des données par les utilisateurs métiers référents, et d’automatiser le dédoublonnage  de gros volumes de données afin qu’ils puissent être traités plus rapidement et de façon plus intelligente. De plus, la nouvelle prise en charge d'Apache Atlas permet d’assurer la traçabilité des données dans Hadoop et ainsi, de mieux gérer les risques et la conformité.

« De nombreuses entreprises ont pris des initiatives de gouvernance des données en raison d'incidents embarrassants ou réglementaires, ou parce que l’utilisateur métier ne pouvaient faire confiance aux données. Certaines entreprises voient la gouvernance des données comme un problème relevant du département informatique et non lié au business », déclare Stewart Bond, directeur de la recherche du service data intregation software chez IDC. « La meilleure approche pour gérer la gouvernance des données est d'engager des utilisateurs métiers lors du processus de gouvernance des données. Le fait de posséder une connaissance accrue des données permet aux utilisateurs d'améliorer la fiabilité des données et leur valeur grâce à l'enrichissement, le nettoyage, la standardisation et la certification, qui augmentent la confiance lors de la prise de décisions basées sur les données. »

Des investissements adaptables pour avoir l'esprit tranquille

Les technologies big data et cloud évoluent rapidement : les plateformes que les clients achètent aujourd'hui peuvent devenir obsolètes en quelques mois seulement. Bâti sur les standards technologiques et une architecture open source, Talend Data Fabric s'adapte plus naturellement aux changements que les solutions logicielles propriétaires. Les innovations continues proposées par la communauté de développeurs open source, ainsi que des nombreux partenaires big data et cloud, garantissent que Talend Data Fabric reste en phase avec les nouvelles technologies. En outre, Talend Data Fabric intègre un générateur de code basé sur des modèles, qui permet facilement de s'adapter aux technologies émergentes. Par exemple, la génération de code pour faire la transition d'une tâche ou d'une application de Spark 1.6 à Spark 2.0 peut être effectuée en quelques clics seulement. Toutes ces fonctionnalités offrent aux clients la garantie que leurs investissements technologiques sont sécurisés sur le long terme et n'auront pas besoin d'être remplacés tous les deux ans.

Prix et disponibilités

Talend Data Fabric sera disponible dès le 19 janvier 2017. Les clients achetant une licence pour la nouvelle version de Talend Data Fabric recevront deux licences utilisateurs supplémentaires de l’application Talend Data Stewardship et de la solution Talend Data Preparation. Pour plus d'informations sur nos tarifs et nos offres, veuillez contacter un représentant commercial Talend à l'adresse sales.fr@talend.com.

Pour en savoir plus sur les capacités et les avantages de la version Winter’17 de Talend Data Fabric, les clients peuvent s'inscrire au webinar « Talend Winter’17 : Transformez votre data lake pour obtenir des informations plus rapidement », qui se tiendra le jeudi 19 janvier de 14h30 à 15h30.

Vous aimez cette histoire ? Partagez-la sur Twitter : .@Talend accélère la prise de décisions avec la nouvelle version de Data Fabric. Découvrez les fonctionnalités http://bit.ly/1L7jEVV



[1] Gartner, Inc., “Defining the Data Lake,” Nick Heudecker, Mark A. Beyer, Novembre 2016.