Comment améliorer la qualité des données [Étape 10 du RGPD]

Le Règlement général sur la protection des données (RGPD), introduit par l’Union européenne, est entré en vigueur le 25 mai 2018. Avec l’introduction du RGPD, les organisations doivent garantir l’exhaustivité et l’exactitude des données à caractère personnel des personnes concernées telles que les clients, les employés et les prospects.

Talend a récemment mis en ligne un webinaire à la demande, Étapes pratiques pour la mise en conformité au RGPD, qui porte sur un plan global en 16 étapes de mise en œuvre d’un programme de gouvernance des données visant à assurer la conformité au RGPD.

L’amélioration de la qualité des données est l’Étape 10 de ce plan. Pour en savoir plus sur les neuf premières étapes, consultez les liens dans la barre latérale !

Télécharger Comment améliorer la qualité des données [Étape 10 du RGPD] maintenant
En savoir plus

Le point de vue du RGPD sur la qualité des données

L’Article 16 du RGPD exige que les entreprises rectifient les informations personnelles qui sont inexactes et qu’elles complètent les données à caractère personnel incomplètes dans les meilleurs délais. Les équipes de gouvernance doivent mettre en place des contrôles pour permettre aux personnes concernées de régler les problèmes de qualité des données touchant leurs informations personnelles dans les meilleurs délais.

Le rapprochement des données est également essentiel : les données des clients et des employés peuvent être réparties dans de nombreux endroits et systèmes au sein de l’entreprise. Le RGPD impose le rapprochement de ces informations au sein d’une vue cohérente et exhaustive afin qu’elles puissent être présentées aux personnes concernées à leur demande.

Utiliser Talend pour la qualité des données

Les données de mauvaise qualité coûtent $3des milliards de dollars chaque année aux entreprises américaines. Elles sont la cause de la mauvaise compréhension des clients et de la non-conformité au RGPD, qui peut être sanctionnée de lourdes amendes. À l’évidence, c’est un sujet crucial pour la majorité des entreprises.

Voici quelques facteurs responsables de la mauvaise qualité des données et les outils de Talend qui permettent d’y remédier :

  1. Silos de données — Dans le monde des big data, les informations proviennent de multiples sources et systèmes. Talend Data Integration Platform agrège les données provenant de différentes sources dans une plateforme commune.
  2. Diversité de technologies — Comme les entreprises travaillent avec une multitude de technologies, les données se présentent sous différents formats. Talend Data Integration Platform facilite l’intégration de divers outils et applications à n’importe quelle technologie (par exemple, rédiger une tâche MapReduce ou Spark) et présente les données dans un format cohérent.
  3. Données incohérentes — Comme les données proviennent de sources diverses, elles peuvent présenter des différences. Par exemple, il se peut que les systèmes de marketing et de vente aient plusieurs enregistrements du numéro de téléphone portable d’un même client. Talend Data Quality et Talend Data Stewardship facilitent le rapprochement de ces données dans un enregistrement maître (une version unique de la vérité).

Intégration avec le cycle de vie de la qualité des données

Talend Data Quality facile la résolution des problèmes à chaque étape du cycle de vie de la qualité des données (Figure 1). Ce produit offre des solutions pour tous les scénarios : de la découverte de problèmes et la normalisation des données par le biais de bibliothèques, à la résolution des doublons et l’agrégation des enregistrements en une version unique de la vérité, en passant par le suivi continu de la qualité des données.

améliorer la qualité des données

Figure 1 : Cycle de vie de la qualité des données


Il crée un code natif pour exécuter des contrôles de la qualité des données et procéder à l’anonymisation des données au bon endroit (sur site dans un cluster Hadoop ou dans le cloud) et au bon moment (sur les données stockées ou sur les flux de données). Il offre également des fonctionnalités avancées de déduplication et mise en correspondance permettant de rapprocher et relier les ensembles de données entre systèmes (voir Figure 2).

Talend Data Quality

Figure 2. Talend Data Quality peut mettre automatiquement en correspondance des données à caractère personnel et de nouvelles sources de données, en fonction de modèles, de dictionnaires ou d’ontologies, puis identifier ou appliquer des règles aux données mises en évidence.

Les entreprises doivent aussi déléguer le pouvoir des responsables de la protection des données aux intendants des données ou aux utilisateurs professionnels. Par exemple, un ingénieur commercial peut être mieux placé pour s’assurer que les coordonnées de ses clients sont exactes et actualisées. Un responsable des campagnes doit s’assurer qu’un mécanisme de consentement a été mis en place et saisi dans la base de données marketing.

Pour garantir que chaque collaborateur puisse gérer l’utilisation qu’il fait de ses données en toute conformité, les entreprises doivent doter les différents départements d’applications en libre-service basées sur des flux de travail, telles que Talend Data Preparation et Talend Data Stewardship. Ils auront une plus grande autonomie sans compromettre les données (voir Figure 3).

Talend Data Quality

Figure 3 : Talend Data Stewardship assure l’orchestration des workflows d’intendance et la délégation des activités à virtuellement n’importe quel membre de l’entreprise.

Étapes suivantes vers l’amélioration de la qualité des données

Il est crucial que les entreprises s'attachent à l’amélioration des données pour respecter le RGPD. Compte tenu de la complexité de l’environnement logiciel, ce travail peut être effectué rapidement et systématiquement grâce à des solutions et outils en libre-service automatisés qui collectent, rapprochent et consolident les données.

L’étape suivante du plan global en 16 étapes de Talend pour le RGPD est la reconstitution du lignage des données.

Pour en savoir plus à ce sujet et voir l’ensemble des 16 étapes, ne manquez pas notre webinaire à la demande, Étapes pratiques de la conformité au RGPD. Cette vidéo comprend des informations sur le développement de normes et contrôles, l’identification des propriétaires de données, l’identification d’éléments de données critiques, la mise en œuvre d’évaluations du risque, l’amélioration de la qualité des données et bien d’autres sujets encore.

| Last Updated: September 18th, 2019