Bibliothèque de ressources

Qu’est-ce que la gestion des données ?

Le terme « gestion des données » désigne l'ensemble des pratiques nécessaires à la construction et maintenance d'un cadre/framework pour l'importation, le stockage, l'exploration et l'archivage des données nécessaires aux activités de l'entreprise. Dans ce document, vous allez découvrir 7 types de gestion des données, les avantages d'une gestion efficace, 3 meilleures pratiques à mettre en place et des conseils pour la sélection des meilleurs outils.

En savoir plus

Qu’est-ce que l’intégration de données ?

L'intégration des données est le processus qui consiste à combiner des données provenant de différentes sources dans une vue unifiée, ce qui les rend plus exploitables et plus utiles pour les utilisateurs qui les consultent. Dans tous les secteurs, les entreprises ont commencé à mettre en place des initiatives d'intégration de leurs données pour les analyser plus efficacement. Ces initiatives ont pour but d'améliorer la prise de décision stratégique et d'augmenter la compétitivité des entreprises.

En savoir plus

ELT ou ETL : Définir la différence

La différence entre l’ETL et l’ELT réside dans le fait que les données sont transformées en informations décisionnelles et dans la quantité de données conservée dans les entrepôts. Découvrez ce que signifie ces différences pour les données décisionnelles, la meilleure approche pour votre entreprise et pourquoi le Cloud est un élément décisif.

En savoir plus

Outils ETL – Comment évaluer les outils ETL en cloud

Le terme « outils ETL » désigne une catégorie d’applications et de processus utilisés pour transformer les données brutes provenant de sources disparates en Business Intelligence propre et exploitable. Apprenez à identifier les outils dont vous avez besoin et consultez la liste des spécifications à rechercher.

En savoir plus

ETL et Salesforce

Combiner un processus ETL à Salesforce permet aux entreprises d'exploiter au mieux leurs données Salesforce. Dans cet article, nous présentons le processus ETL et décrivons précisément tout ce dont vous avez besoin pour assurer une migration de données rapide et fiable.

En savoir plus

Qu’est-ce que la gestion des données de référence MDM ?

La « gestion des données de référence » (Master Data Management/MDM) est une méthode de travail qui permet à une entreprise de disposer en permanence de données exactes et à jour et de prendre des décisions plus efficaces grâce à ces données fiables. Dans cette page, vous allez découvrir les points suivants : principaux avantages de cette solution pour une entreprise, défis à envisager, comment faire les premiers pas dans cette discipline.

En savoir plus

Hadoop – Présentation générale

Hadoop est un framework Java open source utilisé pour le stockage et traitement des big data. Les données sont stockées sur des serveurs standard peu coûteux configurés en clusters. Le système de fichiers distribué Hadoop supporte des fonctionnalités de traitement concurrent et de tolérance aux incidents.

En savoir plus

Data lake vs data warehouse

Les termes « data lake » et « data warehouse » sont utilisés très couramment pour parler du stockage des big data, mais ils ne sont pas interchangeables (et noter qu'il n'est pas d'usage de rendre ces termes par un équivalent français). Un data lake est un vaste gisement (pool) de données brutes dont le but n'a pas été précisé. Un data warehouse est un référentiel de données structurées et filtrées qui ont déjà été transformées dans un but spécifique.

En savoir plus

MapReduce – Présentation générale

MapReduce est un modèle de programmation disponible dans les environnements Hadoop qui est utilisé pour accéder aux big data stockées dans le Hadoop File System (HDFS). La fonction map analyse les entrées, les paires et les processus et elle produit un autre ensemble de paires intermédiaires en sortie.

En savoir plus

Data mart – Présentation générale

Un « data mart » est une base de données dont le contenu est en rapport avec une activité de l'entreprise et qui est créée pour répondre aux besoins spécifiques d'un groupe d'utilisateurs. Les data marts accélèrent les processus de l'entreprise en facilitant l'accès aux données stockées dans un data warehouse (ou autre gisement de données opérationnelles) en quelques jours au lieu de plusieurs mois ou plus.

En savoir plus

Tests ETL – Présentation générale

Les tests ETL sont appliqués tout au long du processus ETL pour valider, vérifier et garantir la qualité des données tout en évitant la duplication des enregistrements et la perte de données. Ce document vous propose de découvrir les huit étapes des tests ETL, les neuf types de tests ETL, les défis les plus courants, comment identifier les outils les mieux adaptés à vos besoins, etc.

En savoir plus

Qu’est-ce qu’un data lake ?

Un data lake est un emplacement de stockage centralisé qui contient des big data sous un format brut provenant d'un grand nombre de sources. Les avantages du format data lake incitent de nombreuses entreprises à abandonner leurs data warehouses. Découvrez les avantages spécifiques des data lakes, pourquoi ils sont de plus en plus populaires et comment faire vos premiers pas pour en créer un.

En savoir plus


affichage des pages of 3