Aperçu
Définir le Big Data et son rôle dans le monde actuel
La définition du Big Data continue d'évoluer à mesure que la technologie progresse. Découvrez les dernières tendances et ce que cela signifie pour votre entreprise.
Aux origines du « Big Data »
La première mention du terme « Big Data » est apparue dans la bibliothèque de l’Association for Computer Machinery (ACM) il y a plus de deux décennies. Selon Michael Cox et David Ellsworth : « La visualisation représente un défi intéressant pour les systèmes informatiques : les ensembles de données sont généralement très volumineux, ce qui entrave les capacités de la mémoire principale, du disque local et même du disque distant. Nous appelons cela le problème du Big Data. Lorsque les ensembles de données sont trop vastes pour être sauvegardés dans la mémoire principale (en coeur de système), ou lorsqu’ils ne tiennent pas même sur le disque local, la solution la plus courante consiste à acheter davantage de ressources. » En d’autres termes, à l’époque, le Big Data se définissait essentiellement par « une quantité de données qui ne pouvaient plus être sauvegardées sur le matériel disponible ».
Qu’est-ce que le Big Data aujourd’hui ?
Un peu plus de deux décennies plus tard, après l’explosion d’Internet, des smartphones, de l’Internet of Things (IoT) et de l'informatique dans le cloud, la définition du Big Data s’est étendue bien au-delà des limites du « disque local ».
La définition du Big Data fournie par Wikipédia est la suivante : « un domaine qui étudie les moyens d’analyser et de traiter des ensembles de données trop volumineux ou complexes pour être gérés par des logiciels applicatifs de traitement de données traditionnels afin d'obtenir des informations ». Certains experts définissent ce qui relève du Big Data selon la règle des « quatre 'V' » : le volume, ou la quantité d’informations produites ; la variété, à savoir la diversité des données; la vitesse, qui fait référence à la rapidité à laquelle les données sont créées; et la véracité, soit l’intégrité et l’exactitude des données qui sont créées et collectées.
Toutefois, beaucoup considèrent ces définitions comme trop imprécises. Quiconque tape « qu’est-ce que le Big Data » sur Quora ou Google obtient un large éventail de réponses, tandis que les curieux peuvent se poser les questions suivantes : « Quelle doit être la taille de ces ensembles de données pour être considérées comme 'Big' ? Si le 'Big Data' est un type de données qui ne peut pas être traité à l'aide des outils habituels, qu'est-ce qu'on entend par 'habituels' ? » Il est évident que même si une définition précise du Big Data devait voir le jour, l’accumulation de vastes quantités d’ensembles de données collectées ne constitue pas forcément un objectif adapté aux besoins des entreprises actuelles.
Une nouvelle définition du Big Data
En 2015, Nick Heudecker, analyste chez Gartner, déclarait que le Big Data n'était « plus un sujet en soi ». Au lieu de cela, le terme pourrait maintenant se diviser en plusieurs concepts, parmi lesquels l’analyse avancée ou la data science, la business intelligence, la gestion de l’information d’entreprise, etc. Selon lui : « Les caractéristiques qui ont défini le Big Data [...] n'ont plus rien d'exotique. Elles sont devenues communes. Le paysage technologique continue d’évoluer rapidement, mais les nouvelles options ressemblent de plus en plus aux options précédentes et ces dernières évoluent rapidement. » Une meilleure approche, selon Heudecker, consisterait à penser moins au « Big Data » « qu'aux besoins réels de l’entreprise, à l'impact possible sur l’infrastructure et à la manière dont les architectures d’entreprise doivent évoluer ».
Ces déclarations ont fourni à Teradata un cadre utile pour aider les entreprises à obtenir des résultats tangibles à partir de leurs données. Nous avons trouvé qu’il était préférable de penser le Big Data en fonction des actions à valeur ajoutée qui font réellement évoluer les entreprises. Trop souvent, celles-ci consacrent trop de temps, d’efforts et d’argent à la préparation et au chargement de Big Data et pas suffisamment de ressources à l’analyse appliquée afin d'obtenir des informations qui leur permettraient de faire la différence.
Le Big Data n’est pas une approche ou un outil unique – dans certains cas, par exemple, il est nécessaire de bénéficier de visualisations, alors que dans d'autres, l’analyse connectée constitue une solution adaptée. Comme tant d’autres éléments du Big Data, cela se résume à des problèmes et des objectifs métier. Il faut se demander ce que les utilisateurs recherchent :
-
Des modèles temporels ou des visualisations géographiques des données de marché,
-
Des informations sur les processus tirés de logs de machines ou de données émanant de capteurs ou
-
Des corrélations entre les modèles comportementaux concernant un produit, plusieurs produits ou un produit qui n’a pas encore été lancé.
Le Big Data est souvent lié aux capacités prédictives et aux moteurs de recommandation. Mais il concerne également les actions opérationnelles guidées par la l'état du marché. Il s'agit de bénéficier d'une compréhension plus approfondie de la structure et de la nature des relations entre les personnes et les processus et de définir des modèles qui mènent aux résultats définis par l’utilisateur.
En fin de compte, une définition du Big Data dépend de la manière dont une entreprise particulière exploite ces données. Alors que les experts débattent de la question de savoir s'il ne vaudrait pas mieux se concentrer sur la minimisation des données et les données intelligentes plutôt que sur le Big Data, les entreprises qui seront couronnées de succès seront celles qui se focaliseront sur l’exploitation des données pour créer de la valeur métier. Le Big Data nécessite une conception stratégique et une architecture réfléchie qui examine les flux de données et les référentiels actuels, tout en tenant compte des objectifs métier spécifiques, du comportement des clients et des tendances du marché à long terme.
Vous souhaitez savoir comment Teradata peut vous aider à exploiter efficacement vos données ? En savoir plus sur nos solutions Big Data