Aperçu
Innover à l'aide d'un entrepôt de données intégré (IDW)
En plus d’être la seule source de vérité pour une organisation, découvrez pourquoi il est toujours important de disposer d'un entrepôt de données intégré (IDW).
Dans l'environnement numérique actuel, les informations provenant d'individus, de produits ou d'appareils affluent à un rythme effréné. L'un des principaux défis de l'entreposage de données consiste à capturer, combiner et analyser une telle diversité de données. C'est là tout l'objectif de l'entrepôt de données intégré (IDW). Il s'agit d'un magasin centralisé qui contient des données détaillées et synthétiques en combinant efficacement plusieurs thèmes et services de l'entreprise afin de bénéficier d'une vue à 360° d'une division fonctionnelle.
Deux méthodes d'intégration des données
Lorsqu'ils conçoivent des systèmes d’intégration de données, les architectes système adoptent généralement l’une des deux philosophies développées par William Inmon et Ralph Kimball, pionniers dans le domaine de la conception d’entrepôts de données :
- La méthode Inmon, dite approche « descendante », identifie les thèmes et les entités opérationnelles au sein de l’entreprise, tels que le client, le produit et le fournisseur. Un modèle logique détaillé est conçu pour chaque entité principale et toutes les données sont intégrées et définies à l’avance. Ce modèle facilite le chargement des données, mais rend la structuration des requêtes plus difficile.
- La méthode Kimball, dite approche « ascendante », identifie les principaux processus métier et les questions auxquelles l’entrepôt de données cherche à répondre, avant de créer des data marts pour répondre à ces besoins. Les données sont chargées au sein d'un espace intermédiaire mais ne sont pas étroitement couplées avec les entités correspondantes, contrairement au modèle Inmon.
L’un des principaux avantages de la méthode Inmon réside dans le fait que l’entrepôt de données tient lieu à la fois de source de vérité unique, mais aussi d’espace où toutes les données sont intégrées et standardisées ; contrairement à la méthode Kimball, où les données ne sont pas entièrement intégrées avant l'exécution de requêtes. Cependant, la méthode Kimball permet de construire l'entrepôt de données rapidement et de l’appliquer efficacement aux applications métier.
Teradata préconise la méthode « descendante » d'Inmon, celle-ci offre aux utilisateurs la liberté d'envoyer des requêtes et de poser n’importe quelle question à tout moment sur n’importe quelle donnée. De par sa conception, l'entreposage de données favorise l’inspection en passant à la question suivante pour comprendre la cause originelle. Dans la méthode Kimball, un utilisateur peut être amené à revenir en arrière et à effectuer une refonte complète pour pouvoir répondre à des questions essentielles, ce qui allonge de fait le temps nécessaire pour obtenir des réponses spécifiques.
Pourquoi est-il important de disposer d'un entrepôt de données intégré (IDW) ?
En intégrant de vastes quantités de données issues de sources variées de manière à ce qu'elles soient accessibles au plus grand nombre, les entreprises peuvent :
Partager les informations entre les divisions fonctionnelles
Des sources de données disparates sont rassemblées en un seul endroit, ce qui limite la création éventuelle de silos au sein de l'entreprise et assure la cohérence des données.
Fournir rapidement des réponses précises aux questions essentielles, tout en intégrant plusieurs points de vue
Il est possible d'obtenir des réponses efficaces aux questions métiers les plus ardues afin de permettre aux décideurs de choisir la meilleure option stratégique.
Mettre en avant une version de la vérité unique
Tous les collaborateurs de l'entreprise peuvent ainsi travailler à partir des mêmes informations pour tirer des conclusions sur l’état de l’activité. Ce niveau d’accès universel soulage l’équipe informatique, puisque cela permet à davantage de data scientists improvisés peuvent ajouter de la valeur.
Ces capacités ont le potentiel de transformer la culture d'entreprise en profondeur en ce qui concerne l'accessibilité aux données. Plutôt que de limiter l'accès des utilisateurs aux données et d'entraver l'innovation, un IDW bien conçu peut les rendre disponibles en toute sécurité et dans des formats adaptés aux besoins des utilisateurs. L'analyse gagne ainsi en agilité et en rapidité, ce qui permet aux utilisateurs métiers et aux data scientists d'obtenir des réponses aux questions cruciales pour l'entreprise.
L'évolution de l’entrepôt de données intégré (IDW)
Alors que l'idée d'un entrepôt de données est apparue pour la première fois dans les années 1960 et 1970, une idée révolutionnaire a vu le jour en 1988 grâce à Barry Devlin et Paul Murphy. Ceux-ci ont évoqué la nécessité de disposer d'un « entrepôt intégré de données d’entreprise » capable de « rassembler les différents aspects de l’activité des systèmes d’information au sein de l’entreprise. »
Pendant des décennies, les informaticiens ont tenté de définir la meilleure manière de mettre en place ce type de plateforme à l'échelle. En 1991, l’Integrated Public Use Microdata Series (IPUMS) a démontré toute la puissance de l'entreposage de données en adoptant la méthode "extraire, transformer et charger" (ETL) afin d'intégrer des données issues de variées sources au sein d'un seul et même système.
Le développement d’Internet, l’émergence des smartphones et l’essor du cloud computing ont provoqué une explosion de la quantité de données produites. Il est devenu difficile d'appliquer la méthode ETL à des ensembles de données qui doivent constamment être mis à jour. Depuis, de nouvelles approches ont vu le jour, grâce notamment aux data hubs et aux data lakes. Ces solutions permettent de regrouper des données non structurées sans avoir besoin de passer par des processus où données relationnelles étroitement associées.
Le point de vue de Teradata
Depuis plus de quatre décennies, Teradata est à la pointe de la conception et du développement des IDW. Aujourd’hui, l'entreprise poursuit sa course à l'innovation dans ce domaine en appliquant à la plateforme Teradata Vantage les bonnes pratiques sur le marché.
Teradata Vantage est le logiciel cloud hybride de référence dédié à l'analyse de données, qui exploite l'ensemble de vos données et permet de tout analyser, n’importe où et à tout moment. En combinant la puissance et l’ingéniosité de l’IDW avec les capacités de flexibilité et d’évolutivité du cloud, Teradata Vantage est conçue et proposée à des tarifs qui vous permettent d'obtenir le meilleur niveau de performance à l'échelle du secteur. Cette plateforme simple à utiliser et à intégrer avec vos systèmes actuels vous offre une grande flexibilité tout en gardant le contrôle, quels que soient vos besoins ou l'évolution des outils technologiques disponibles.