Aperçu
Les 5 caractéristiques incontournables des technologies de Big Data
Il existe cinq éléments essentiels pour créer une infrastructure technologique Big Data à valeur ajoutée.
Répondre à la demande des entreprise en matière de technologies de Big Data a été l’une des principales raisons de la création de Teradata. En effet, le nom de l’entreprise découle de sa capacité à gérer plusieurs téraoctets de données (qui se dénombrent aujourd'hui en pétaoctets). À l’époque, le stockage et l’analyse de vastes volumes de données étaient limités en raison du matériel disponible. La base de données Teradata a été créée afin de gérer efficacement les données à l'échelle pour permettre aux entreprises de les analyser, résoudre les problèmes techniques et démontrer la puissance de l’intégration de données au sein d'un modèle relationnel.
Aujourd’hui, alors que les entrepôts de données exécutent des dizaines de millions de requêtes par jour et prennent en charge les opérations essentielles des entreprises, les défis technologiques ont évolué bien au-delà des limites du matériel. Afin de gérer à des données de plus en plus nombreuses et variées, les entreprises ont besoin d’une architecture de Big Data qui achemine les données vers les bons utilisateurs à l'aide d'outils appropriés.
Les questions qu'il faut se poser pour mettre en place une architecture de Big Data
Pour concevoir l’architecture qui répond aux besoins d'une entreprise, il faut souvent commencer par se poser les bonnes questions :
- Comment les stratégies de Big Data influent-elles sur les besoins de l'entreprise en matière de technologies adaptées ? En d’autres termes : quels problèmes métier permet-elle de résoudre, quelles opérations peut-elle améliorer et quels objectifs permet-elle d'atteindre en exploitant le Big Data ?
- Quels sont les sources de données et les systèmes existants qui peuvent être « connectés » au sein d'une architecture intégrée ?
- Comment prendre en compte de nouveaux ensembles de données (comme les données de capteurs ou de l’Internet of Things) ?
- Comment l'approche de l'entreprise permet-elle d'adopter une mentalité data-driven et centrée sur l'analyse de données au sein de l'entreprise ?
- Quels sont les composants nécessaires pour « opérationnaliser » ou permettre au programme de Big Data et d'analyse de données d'évoluer au-delà des phases pilotes ?
Les caractéristiques incontournables des technologies de Big Data
Notre expérience auprès des milliers d’entreprises du monde entier nous a permis de mettre en lumière cinq critères essentiels à la création de plateformes de Big Data fonctionnelles. Selon Teradata, une architecture de Big Data doit être :
1. Intégrée
L’unification des entrepôts de données, des data lakes et de l'analyse de données au sein d'une plateforme unique permet d'établir des ponts entre les sources de données brutes, les outils de business intelligence spécifiques et les applications CRM standard. Cela réduit considérablement la complexité des environnements « hybrides » traditionnels et permet aux entreprises d’ingérer des ensembles de données extrêmement changeants, tout en permettant également aux utilisateurs d'accéder aux moteurs de données et d’analyse depuis de multiples plateformes.
2. Évolutive
Au cours d'une récente enquête menée par IDC, 56 % des personnes interrogées ont déclaré qu’elles n'opteraient pas pour un fournisseur d’infrastructure informatique ou un fournisseur de services cloud si celui-ci ne leur offrait pas des options de consommation flexibles. En réponse aux demandes formulées par ses clients, Teradata a développé Vantage, sa plateforme logicielle d’analyse de données, afin de leur permettre de consommer de la manière qui leur convient le mieux, que ce soit dans le cloud, sur une infrastructure hybride ou sur site. Nous sommes conscients du fait que nos clients ne seront peut-être pas en mesure de prédire l’étendue des capacités d'analyse dont ils auront besoin le mois prochain - et encore moins l’année prochaine. C’est pourquoi nous leur offrons la flexibilité nécessaire pour ajuster leurs charges de travail d'analyse de données à mesure que leurs stratégies de déploiement évoluent.
3. Prédictive
De nombreux analystes et autres experts affirment que la capacité actuelle des entreprises à collecter et à gérer les données de Big Data constitue une fin de non-recevoir : en matière de Big Data, seule importe leur aptitude à prédire les évolutions ou à agir. C’est là que l’intelligence artificielle (IA) et son sous-ensemble, le machine learning, entrent en ligne de compte. Le machine learning donne aux ordinateurs la possibilité d’apprendre sans avoir besoin de programmation manuelle, ce qui permet aux entreprises de détecter des schémas et de mettre au point des modèles à partir de leurs données afin de prédire des scénarios futurs. Cela peut se révéler extrêmement utile pour déterminer la propension d'un client à acheter un produit, optimiser le rendement de chaque machine au sein d'un atelier de fabrication ou renforcer la posture sécuritaire d'une entreprise.
Lorsque Teradata a développé Vantage, l'entreprise a attaché une attention particulière à ce que la plateforme puisse prendre en charge un large ensemble de fonctions d'analyse avancées. Le moteur de machine learning fournit notamment plus de 100 fonctions prédéfinies dédiées à l'analyse des chemins, des modèles, des statistiques et des textes afin d'effectuer un large éventail d’analyses. De la même manière, le moteur graphique offre un ensemble de fonctions qui montrent les relations existantes entre les individus, les produits et les processus au sein d’un réseau.
4. Accessible
Il est possible de réduire le nombre de silos de données et de stimuler l’innovation au sein de l'entreprise grâce à la mise en place de technologies et de politiques qui favorisent l’analyse en libre-service. Idéalement, les collaborateurs de l'entreprise ont accès aux ensemble d’outils et de données dont ils ont besoin pour travailler efficacement, sans avoir à demander d’autorisations au service informatique. Cela leur permet de passer moins de temps à faire le lien entre différentes solutions et davantage à chercher et à mettre en application des réponses aux problèmes stratégiques les plus cruciaux pour l’entreprise.
La technologie doit également prendre en charge les langages et les outils préférés des utilisateurs. Grâce à Vantage, data scientists et analystes commerciaux peuvent travailler à partir de données identiques, même s’ils utilisent des outils et des langages différents. Vantage intègre les outils et les langages favoris de ses clients, notamment SQL, R, Python, Tableau, Qlik and Teradata AppCenter, Jupyter et RStudio.
5. Ouverte pour encourager l’innovation
Les cas d'usage émergents en matière d'analyse de données avancée et l’explosion des multiples types et sources de données obligent les data scientists à tirer parti de diverses techniques de data science. La technologie utilisée doit être exhaustive et capable de résoudre les problèmes métiers d’aujourd’hui et de demain. Il est donc nécessaire de mettre en place une architecture compatible avec l'ensemble des outils et des technologies futurs. À ces fins, Teradata a développé Vantage afin de combiner les technologies d'analyse de données open source et commerciales.
Les technologies qui favorisent l’analyse de Big Data évoluent rapidement. Afin de mettre au point une stratégie technologique de Big Data durable sur le long terme, il est essentiel de construire une architecture qui intègre divers flux de données, outils et applications. Celle-ci doit pouvoir évoluer en fonction des besoins de l’entreprise, prendre en charge les capacités avancées d’analyse prédictive, être accessible à tous les collaborateurs de l'entreprise, peu importe leur fonction, et ouverte pour intégrer les futures innovations qui émergeront inévitablement. Si votre architecture de Big Data remplit ces critères, votre entreprise sera bien équipée pour prendre un avantage compétitif à mesure que l’économie des données à l'échelle mndiale continue de se développer.