Cinq considérations essentielles pour développer une stratégie de gouvernance des données

Cinq considérations essentielles pour développer une stratégie de gouvernance des données

  • Nitin Kudikala
    Nitin Kudikala is a Customer Success Architect at Talend. In this role, Mr.Kudikala advises firms on how to create value by becoming Data Driven and ensures that they are empowered to use the Talend software in the most optimal way. He has 15 years of experience in the field of Data Governance, Data Quality, Data Warehousing, Master Data Management and Big Data. Prior to Talend, he worked as a Data Management Specialist at PepsiCo and before that as a Senior Consultant at Informatica Corporation.

Dans un blog Talend précédent, j’ai partagé quelques conseils clés que toute entreprise devrait garder à l’esprit lorsqu’elle conçoit des processus de qualité des données (QD) dans Hadoop. Les processus et cadres relatifs aux données que j’ai mentionnés dans ce blog sont importants parce qu’ils affectent votre programme de qualité des données, mais également votre programme de gouvernance des données, si vous en avez un, bien sûr ! Alors, avez-vous un programme de gouvernance des données ? C’est une question délicate car le concept de gouvernance des données n’est pas totalement compris. Dans une certaine mesure, votre entreprise fait déjà de la gouvernance des données sans que vous vous en rendiez compte. Ce qui soulève la question : qu’est-ce que la gouvernance des données (GD) ?

The Data Governance Institute définit la gouvernance des données comme « un système de droits de décision et de responsabilités en matière de processus liés aux informations, exécuté selon des modèles convenus précisant qui peut prendre quelles mesures avec quelles informations, quand, dans quelles circonstances et avec quelles méthodes. » C’est une réponse un peu longue. Mais ce qu’il faut retenir, c’est que la gouvernance des données est un ensemble de normes, politiques et modèles réutilisables.

Si vous possédez un entrepôt de données (ED) (l’approche classique pour tirer des informations exploitables des données), vous disposez certainement déjà de cadres et normes de gouvernance des données pour vos tableaux de dimensions. Quand on aborde les bonnes pratiques en matière de GD, il faut d’abord bien comprendre ce qu’est la GD pour votre entreprise.

La gouvernance des données pour VOTRE entreprise

J’ai entendu dire que la GD était l’équivalent de la gestion des données maître (Master Data Management ou MDM). Bien que ce ne soit pas faux, ce n’est pas exact pour autant. La gouvernance des données ne se limite pas forcément à une plateforme ou un concept. En fait, une bonne approche de gouvernance des données peut et doit s’appuyer sur plusieurs plateformes ou projets. La GD est un programme de votre entreprise qui établit les règles et normes relatives aux données. Par exemple, si votre entreprise a besoin d’une solution de reporting des ventes, elle devra répondre à des questions de gouvernance telles que :

  1. Quelles sont les bases de données internes qui détiennent ces informations ?
  2. Qui peut y accéder ?
  3. Avons-nous défini les termes « client » et « prestataire » ?
  4. Les structures des données de vente sont-elles déjà définies ?
  5. Quelle est la qualité des données sources ?
  6. Existe-t-il des indicateurs sur la taille des données ?

Les équipes informatiques seront chargées de proposer des solutions pour le projet et de fournir des services de développement et d’infrastructure. L’équipe de gouvernance des données sera toutefois chargée de conseiller les équipes informatiques sur les politiques et normes relatives aux données. Ce qui nous amène à la considération essentielle suivante.

Le conseil de gouvernance des données

Le conseil est chargé d’établir le cadre de gouvernance des données de l’entreprise. Le cadre de GD doit être adapté aux besoins spécifiques de votre entreprise, mais d’une manière générale, ce cadre peut inclure des tâches de planification stratégique telles que la définition des besoins en données, le développement de politiques et directives relatives aux données, et la planification de projets de gestion des données. Ce cadre doit également inclure des tâches de contrôle continu, telles que la gestion et résolution de problèmes liés aux données, le suivi des politiques relatives aux données et la valorisation des actifs de données.

Comme les équipes de direction des projets informatiques, le conseil de gouvernance des données doit comprendre des membres de l’entreprise et du service informatique. Il est essentiel que l’entreprise adhère à ce programme. Elle sera d’ailleurs activement impliquée dans les tâches de GD.

Il est également essentiel que le conseil soit doté d’une structure organisationnelle flexible. Une bonne pratique consiste à adopter une approche descendante. La direction du conseil supervise la gouvernance, tandis que les analystes et les gestionnaires de données appliquent les politiques. Les gestionnaires de données sont chargés de fournir les retours d’informations nécessaires à la direction.

La communication

La mise en œuvre d’une GD implique un changement considérable d’organisation. C’est pourquoi le conseil de GD doit impérativement trouver une mission qui soit alignée sur les intérêts de l’entreprise et prenne en compte les points forts des équipes de mise en œuvre. La mission des programmes de GD doit être clairement communiquée et exprimer succinctement les principaux moteurs de la GD au sein de l’organisation. Elle doit être communiquée de façon répétée et systématique via divers canaux.

Domaine d’intérêt : un programme de gouvernance des données peut inclure une multitude de domaines d’intérêt et il est important de choisir celui présentant la plus forte valeur ajoutée pour votre entreprise. Ces initiatives peuvent être prises au niveau de l’entreprise ou du projet. Voici quelques domaines d’intérêt accompagnés d’une brève description :

  1. Normes et politiques : ce genre de programme doit collecter les normes existantes, les examiner et les comparer aux normes de la société. Une autre activité importante consiste à définir une stratégie des données pour l’entreprise et à soutenir tout projet cloisonné qui essaie d’intégrer l’environnement de l’entreprise.
  2. La qualité des données (QD) : ce type de programme se charge d’identifier, de corriger et de suivre les problèmes de qualité des données au sein de l’entreprise. En général, ces programmes intègrent un logiciel pour profiler, nettoyer et mettre en correspondance les moteurs. Les initiatives de QD mènent également à des projets de gestion des données maître, qui définissent les données de référence et offrent une vue à 360 degrés de domaines tels que le client ou le prestataire.
  3. La sécurité et confidentialité des données : chaque entreprise a mis en place des exigences en matière de conformité et réglementation. Ce programme doit donc tenter de résoudre ces problèmes en établissant des droits pour gérer l’accès, des contrôles de la sécurité des informations, des procédures de confidentialité des données, etc., en particulier pour les données sensibles.
  4. Architecture/Intégration : ce domaine d’intérêt vise à garantir l’efficacité opérationnelle en simplifiant les composants de l’architecture d’intégration des données tels que la modélisation des données, la modélisation des données de base, l’architecture orientée service, etc.
  5. Stockage des données et Business Intelligence (BI) : ce programme incite à développer des entrepôts et magasins de données pour soutenir le reporting historique, mais aussi le reporting prévisionnel.
  6. Architectures en libre-service : ce type de programme prend en compte les problèmes d’arbitrage et de préparation des données, et vise à développer des flux de travail qui limitent le paradigme du « shadow IT », trop fréquent dans les organisations.

Il s’agit d’un moyen et non d’une fin en soi.

Il est important de comprendre que, à l’instar de la gouvernance d’entreprise, la gouvernance des données n’est pas un projet ponctuel mais un processus permanent. Chaque processus permanent doit avoir des objectifs bien définis et une méthode pour mesurer les avancées du programme. Nous recommandons pour cela d’examiner les progrès au regard d’un modèle de maturité de gouvernance des données. En fonction du domaine d’intérêt que vous avez choisi pour votre programme de GD, votre entreprise doit également disposer d’indicateurs pour évaluer la réussite du programme. Il est également recommandé de recourir à des pratiques agiles. Des méthodes agiles telles que la livraison continue, la collaboration constante entre le service informatique et le service commercial, l’ouverture au changement et une attention sans faille à l’excellence technique ainsi qu’à une bonne conception, s’intègrent parfaitement aux pratiques de gouvernance des données.

Évolution

Tout comme les processus et l’aspect humain, la technologie est un élément essentiel de la gouvernance des données. Et la technologie évolue sans cesse. Que vous soyez commercial ou informaticien, il est recommandé d’adopter les innovations technologiques. Les innovations de l’apprentissage automatique, du Cloud, et de l’espace des Big Data peuvent contribuer à l’efficacité des initiatives de gouvernance des données. Par exemple, en développant un data lake dans Hadoop, vous pouvez réduire le coût de stockage des données de référence et des données de votre entrepôt de données, et accélérer leur traitement.

Il est fort probable que votre entreprise ait déjà pris et mené à bien une de ces initiatives de gouvernance des données. Je vous recommande de vous en servir pour appliquer d’autres domaines d’intérêt. Adoptez une vision de la gouvernance des données dans votre entreprise, obtenez l’adhésion de la direction commerciale et de la direction informatique, et améliorez leur collaboration. Une fois ces premières étapes franchies, la GD peut enfin évoluer et représenter un véritable intérêt pour votre organisation !

Références :

https://www.sas.com/en_us/insights/articles/data-management/what-is-a-data-governance-framework.html

http://www.datagovernance.com/the-dgi-framework/

http://tdan.com/a-ten-step-plan-for-an-effective-data-governance-structure/19183

http://mitiq.mit.edu/IQIS/Documents/CDOIQS_200777/Papers/01_08_1C.pdf

https://www.pcmag.com/article/347785/big-data-basics-how-to-build-a-data-governance-plan

http://www.computerweekly.com/tip/Guidelines-for-data-governance-framework-creation

https://www.dataqualitypro.com/data-governance-design-build-execute-guy-harvey/

https://www.whitepapers.em360tech.com/wp-content/files_mf/white_paper/wp_iway_7steps.pdf

https://www.isaca.org/chapters3/Atlanta/AboutOurChapter/Documents/GW2014/Implementing%20a%20Data%20Governance%20Program%20-%20Chalker%202014.pdf

http://dbhids.org/wp-content/uploads/2016/03/OCIO-DBHIDS-DG-Framework-Strategic-Plan-v1.01.pdf

Participer aux discussions

0 Comments

Laisser un commentaire

Your email address will not be published. Required fields are marked *