Quelle est la différence entre un entrepôt de données et un data mart ?
Un entrepôt de données est à la fois un modèle de structure et une architecture pour des données partagées et détaillées. Il permet d'envoyer des données depuis des centaines de sources et d’applications concernant n'importe quel sujet vers une plateforme de données, où les données sont intégrées et partagées avec tous les utilisateurs.
Un data mart est un référentiel de données qui se concentre sur un seul domaine. Il s'agit également d'un sous-ensemble d'entrepôt de données qui n'est utilisé que par un nombre restreint d'utilisateurs. Les data marts ne permettent d'accéder qu'à une partie de l'ensemble des données contenues dans un entrepôt de données.
Quelles sont les données auxquelles l'entrepôt de données permet d'accéder, contrairement aux magasins ?
Un seul écosystème d’entrepôt de données, intégré et connecté qui rassemble toutes les données, quel que soit le domaine. Les utilisateurs ont ainsi accès à une seule source de vérité unique.
Un magasin de données par domaine. Cela peut conduire à la formation de silos de données, et chacun d'entre eux n'est utile qu'à un petit groupe d’utilisateurs.
C'est ce qui fait la différence entre 1 000 silos de données et un entrepôt de données comportant les mêmes informations.
Combien de tables de données comportent-ils en moyenne ?
> 4 000 tables pour un entrepôt de données
< 20 tables pour un data mart
Quelle quantité de données peuvent-ils stocker ?
> 100 Go pour l'entrepôt de données
< 100 Go pour le data mart
Quelles sont les implications pour les utilisateurs métier et le service informatique ?
Les entrepôts de données rassemblent toutes les données, qui sont nettoyées, gérées, intégrées et gouvernées afin d'obtenir une image complète de l’entreprise.
Les data marts créent des silos, ce qui résulte dans l'augmentation des coûts, de la complexité et des déplacements de données. Les data marts stockent souvent des doublons de données redondantes, ce qui entraîne une « dérive des données », c'est à dire des changements inattendus dans les données qui empêchent les processus de fonctionner.
Les recommandations de Teradata
Teradata préconise de transformer les données pour en faire le principal atout de l'entreprise. Cela nécessite l'élimination des cloisons et des silos, afin d'agréger toutes les données pour pouvoir les analyser.
Teradata recommande d'utiliser une plateforme de données multi-cloud connectée et dédiée à l’analyse de données d’entreprise qui unifie les data lakes, les data marts, les entrepôts de données, l'analyse, les nouvelles sources et les nouveaux types de données. Cette plateforme rend les données accessibles et exploitables, ce qui permet à tous les utilisateurs, quel que soit le département dont ils dépendent, de poser n’importe quelle question à tout moment sur n’importe quelle donnée.
En savoir plus sur Vantage