Quelles sont les nouveautés des applications Self-service de Talend dans l’édition Summer ‘17 ? (Part 2)

article in English

Dans la partie 1 de ce blog, nous avons présenté les bénéfices majeurs que Talend Data Preparation 2.1 (Summer ’17) délivre : en particulier un niveau inégalé d’industrialisation pour l’IT et l’intégration de la préparation de données à tout type de scénario Big Data – batch ou streaming -.

Dans cette partie 2, nous insistons sur les nouveautés Summer ’17 de Talend Data Stewardship. Pourquoi associer les applications dans une série de blogs ?

Depuis Janvier 2017, Talend propose une gamme d’applications de gestion de vos données en self-service qui accélèrent et facilitent la transformation digitale à tous les niveaux de votre organisation. En effet, l’une des clés principales de la réussite de votre transformation digitale est votre agilité à mettre les données dans les mains de tous vos utilisateurs, à exploiter toute leur expérience et leur connaissance des données.

Pour cela, Talend Data Preparation permet librement à tout utilisateur habilité d’accéder, de transformer, de partager et d’intégrer des fichiers de données quelle que soit la source et quelle que soit la destination : vous obtenez des données pertinentes et propres en quelques minutes plutôt qu’en quelques heures. Découvrez la version gratuite de Talend Data Preparation en cliquant ici.

Et Talend Data Stewardship permet de mobiliser tel ou tel expert métier et d’organiser des campagnes d’optimisation des données à travers l’entreprise, comme un catalyseur des connaissances sur les données : vous obtenez des données corrigées, fusionnées, certifiées dans un temps maîtrisé.

Ensemble, Talend Data Preparation et Talend Data Stewardship se complètent pour diffuser la culture data-driven dans l’organisation car elles s’adressent aux mêmes types d’utilisateurs qui peuvent être une fois préparateurs de données et une autre fois data steward. C’est pour cela que les deux applications partagent la même interface utilisateur et sont combinées dans la même licence utilisateur.

Talend Data Stewardship garantit sa haute disponibilité et sa productivité

Plus la culture data-driven se répand dans l’organisation, plus la data stewardship devient un élément critique dans la stratégie de données d’une entreprise, et plus l’application doit être robuste, scalable et industrielle. C’est pourquoi la version Summer ’17 s’appuie sur une architecture haute-disponibilité.

Pour optimiser la productivité des utilisateurs, Talend Data Stewardship Summer ’17 propose d’opérer des actions en masse comme les fonctions d’arbitrage, d’assignation, d’acceptation, de refus des données. Dans le même but, l’utilisateur pilote le rythme de son travail en fonction d’un délai maximal de résolution de ses tâches affiché dans sa liste de tâches. Il peut ainsi garantir un Service Level Agreement au commanditaire de la campagne.

Talend Data Stewardship utilise le Machine Learning pour gérer vos doublons

L’application permettait d’orchestrer des campagnes de « merging » de plusieurs sources de données, des campagnes « d’arbitration » entre plusieurs sources de données et des campagnes de « resolution » d’erreurs.

Parce que la gestion des doublons est l’une des situations d’usage les plus chronophages et les plus critiques pour améliorer la qualité des données, Talend Data Stewardship Summer ’17 gère les campagnes de « grouping ».

Les jeux de données contenant des doublons comportent souvent des milliers ou des millions de lignes et sont ingérables par un utilisateur. Intégré à une plate-forme Talend Big Data, Talend Data Stewardship apporte une solution : elle présente à l’utilisateur un échantillon du jeu de données pollué par des doublons. Il doit notifier à l’application s’il s’agit d’un doublon ou non ou s’il ne le sait pas. Les résultats de cette évaluation humaine est intégré dans un moteur de Machine Learning sur Spark qui établit des règles de doublons par apprentissage. Ces règles sont ensuite appliquées sur l’ensemble du jeu de données. C’est un gain de temps et une amélioration de la qualité des données considérables.

En dehors d’un contexte Big Data, une campagne de grouping permettra de regrouper les lignes d’un jeu de données selon leur nature : les lignes en doublons ensemble, les faux doublons, les doublons volontaires à conserver. Ainsi chaque catégorie sera traitée différemment : les vrais doublons intègreront une campagne de dédoublonnage gérée dans Talend Studio ; les faux doublons seront séparés et réintégrés dans l’application de destination ; les doublons volontaires subsisteront tels quels.

Parmi les cas d’usage du data stewardship, les projets de Master Data Management sont aussi très fréquents.

Talend Data Stewardship s’intègre naturellement à un projet de Master Data Management

Le but du Master Data Management est de fournir « une seule version de la vérité des données » dans toute l’entreprise : il regroupe dans un référentiel unique toutes les données clients, produits, fournisseurs. Evidemment, il est constamment alimenté de nouvelles sources de données, qui sont autant de risques de détériorer la qualité des données de référence. Et, par nature, c’est un outil centralisé dans l’entreprise : le risque de ne pas arriver à impliquer les utilisateurs finaux des données est grand.

Talend Data Stewardship apporte une double solution à ces enjeux de maintien de la qualité des données et d’adoption utilisateurs : outil intuitif et totalement accessible, l’application permet de mobiliser les utilisateurs qui connaissent le mieux les données dans l’entreprise pour améliorer ou certifier la qualité de leurs propres données. C’est un vecteur de gouvernance des données.

Pour mieux servir sa mission au sein d’un projet de Master Data Management, Talend Data Stewardship Summer ‘17 s’intègre nativement dans Talend Master Data Management pour la gestion du matching des données de référence avec les nouveaux flux de données qui alimentent MDM en continu. Dès qu’une nouvelle donnée matche avec une donnée existante, elle est automatiquement dirigée vers Talend Data Stewardship. Les règles de matching sont paramétrables pour adresser des règles métiers très complexes.

 

La fonction d'Integrated Matching

 

De même, Talend Data Stewardship Summer ’17 travaille sur le même modèle de données que Talend Master Data Management : l’application hérite automatiquement de toute modification du modèle de données MDM. Les modifications sont propagées directement et utilisées pour les contrôles de données dans l’interface de Talend Data Stewardship.

Pour découvrir en action Talend Data Stewardship, regardez cette vidéo de 4 minutes.

 

Share

Leave a comment

Ajouter un commentaire

More information?