Que sont les big data ?
Big data désigne les quantités volumineuses et en constante augmentation de données dont dispose une entreprise et qui ne peuvent pas être analysées à l'aide de méthodes traditionnelles. Le big data comprend des types de données structurées et non structurées, il constitue souvent la matière première sur laquelle les entreprises peuvent effectuer des analyses et extraire des informations qui peuvent les aider à élaborer de meilleures stratégies commerciales. C'est plus qu'un sous-produit des processus et applications technologiques. Le big data est l'un des actifs les plus importants actuellement.
Le big data peut être constitué de données structurées traditionnelles, de données non structurées ou de données semi-structurées. Les données générées par les utilisateurs sur les réseaux sociaux sont un exemple de données non structurées et en constante augmentation. Le traitement de ces données nécessite une approche différente de celle des données structurées, associée à des outils et techniques spécialisés.
Le big data est le sous-produit de l'explosion de l'information d'aujourd'hui. Tous les domaines de l'économie et de la vie quotidienne contribuent à l'accumulation croissante du big data : commerce de détail, immobilier, voyages et tourisme, finance, réseaux sociaux et technologie, tous les aspects de notre vie sont des données, du nombre de pas que nous parcourons jusqu'à notre historique financier.
En 2017, on estimait qu'environ 3,8 milliards de personnes, soit environ 47 % de la population mondiale utilisaient Internet. Le nombre et la variété des appareils électroniques intelligents ont explosé au cours des dernières années et continuent d'augmenter. Les données que nous produisons quotidiennement sont estimées à 2,5 quintillions d'octets et ne cessent de croître.
Vu que le nombre de personnes qui utilisent Internet augmente de façon exponentielle, les données ne dorment jamais.
Les chiffres ci-dessous donnent une idée de la taille du mastodonte qu'est le big data. C'est ce qui se passe dans le cybermonde chaque minute. Faites le calcul.
- Les chaînes météo reçoivent 18 055 555 demandes de prévisions
- Des personnes passent 176 220 appels avec Skype
- Les utilisateurs d'Instagram publient 49 380 photos
- Les utilisateurs de Netflix diffusent 97 222 heures de vidéo en continu
Caractéristiques du big data
Les cinq V du big data sont universellement reconnus :
- Volume
- Vitesse
- Variété
- Véracité
- Valeur
1. Volume
Si l'on considère le big data comme une pyramide, le volume en constituera la large base. Le volume de données que les entreprises du monde entier gèrent a commencé à augmenter en flèche vers 2012, lorsque les organisations ont commencé à collecter plus de trois millions de données par jour. Depuis lors, on estime que ce volume double environ tous les 40 mois, selon un professeur de MBA de l'université Antonio de Nebrija.
2. Vitesse
Le terme « vitesse » fait référence à la vitesse à laquelle les données sont générées.
Ce n'est pas seulement le volume des big data qui peut être un atout : la vitesse à laquelle elles circulent est également importante. Plus les données sont proches du temps réel, plus les entreprises qui cherchent à en extraire des informations exploitables et précieuses en tireront un avantage concurrentiel.
Par exemple, une entreprise de livraison de nourriture décide d'acheter une campagne Google Ads sur la base de ses données de vente 45 minutes avant le début d'un grand événement sportif. Ces mêmes données auront perdu leur pertinence quelques heures plus tard.
Les technologies à l'origine de ce besoin de données rapides comprennent les étiquettes RFID, les compteurs intelligents et divers types de capteurs.
3. Variété
La variété fait référence au spectre des sources à partir desquelles une entreprise peut acquérir des big data et à la pléthore de formats dans lesquels elles peuvent apparaître. Cela inclut des sources comme les smartphones, les appareils internes, les discussions sur les réseaux sociaux, les données des tickets boursiers et les données des transactions financières. La source doit être particulièrement pertinente par rapport à la nature de l'activité pour laquelle les données sont collectées. Par exemple, une entreprise de vente au détail doit être à l'écoute de ce que les utilisateurs disent sur les réseaux sociaux à propos de sa ligne de vêtements récemment lancée. Une entreprise de fabrication aurait moins de valeur intrinsèque à suivre les réseaux sociaux.
Diverses données peuvent également aider les organisations à comprendre les profils et les personas des clients. Par exemple, une entreprise pourrait trouver utile de savoir non seulement combien de personnes ouvrent son bulletin d'information, mais aussi pourquoi elles l'ont ouvert et quelles sont les caractéristiques distinctives du public.
4. Véracité
La véracité met en cause la qualité et l'exactitude des données. Les données propres sont les plus dignes de confiance. Les entreprises doivent connecter, nettoyer et transformer leurs données à travers les systèmes afin de les rendre fiables. Elles ont besoin de hiérarchies et de liens multiples avec les données pour garder le contrôle de ces dernières.
5. Valeur
Au sommet de la pyramide se trouve la valeur, c'est-à-dire la capacité d'extraire des informations commerciales viables de l'avalanche de données.
La valeur, c'est de pouvoir prédire combien de nouveaux membres vont rejoindre le site Web, combien de clients vont renouveler leur police d'assurance, à combien de commandes il faut s'attendre, etc. La valeur, c'est de savoir qui sont les meilleurs clients et qui va disparaître dans quelques semaines ou mois, pour ne plus jamais revenir.
Les entreprises gagnent en valeur grâce à leur capacité à monétiser les informations fournies par le big data. Elles apprennent à mieux connaître leurs clients et continuent à proposer des offres plus pertinentes.

Principaux types et sources de big data
Streaming data
Ce sont les données qui proviennent de l'Internet des objets et des appareils connectés. Ce sont des données qui affluent dans les systèmes par ordre chronologique. Elles peuvent affluer dans les systèmes informatiques à partir d'une multitude de gadgets connectés tels que les smartphones, les dispositifs à porter sur soi, les voitures intelligentes, les équipements industriels et les appareils médicaux. Les streaming data peuvent être analysées sur la base du premier entré ou en continu, en les scannant pour voir si elles valent la peine d'être stockées pour une analyse plus approfondie, ou si elles peuvent être ignorées en toute sécurité.
Données sur les réseaux sociaux :
Les millions d'interactions quotidiennes sur les plateformes de réseaux sociaux telles que Facebook, Instagram, YouTube sous forme de photos, d'images, de GIFS, de vidéos, de voix, de commentaires (SMS) et de fichiers sonores constituent le répertoire de données des réseaux sociaux. Ces données sont particulièrement précieuses pour les ventes, le support et les campagnes de marketing. Le défi réside dans le fait qu'elles se présentent le plus souvent sous une forme non structurée ou semi-structurée, de sorte qu'un traitement supplémentaire est nécessaire avant de pouvoir les analyser.
Données accessibles au public
Il s'agit de l'énorme quantité de sources de données ouvertes, y compris les portails data.gov des principaux gouvernements mondiaux.
Le reste des big data provient du cloud, des lacs de données, des vendeurs, des fournisseurs ou des clients.
Comment sont traitées les big data
Le traitement des big data commence par la mise en place d'une stratégie pour l'exploiter. L'étape suivante consiste à identifier et à cataloguer ses sources, ses emplacements, ses systèmes, ses utilisateurs et ses propriétaires, ainsi que la manière dont elles affluent. Ensuite, il faut créer une infrastructure pour stocker et gérer les données afin qu'elles soient facilement accessibles pour l'analyse, l'étape finale pour faciliter la prise de décision basée sur les données. Ce protocole est utile pour gérer les ensembles de données structurés traditionnels ainsi que les données non structurées et semi-structurées.
Lors de l'élaboration d'une stratégie de gestion du big data, il est impératif de tenir compte des objectifs commerciaux actuels et futurs, tant du point de vue de la croissance de l'entreprise que de la technologie, et de traiter le big data comme n'importe quel autre actif commercial de valeur.
Les données peuvent être stockées sur place dans un entrepôt de données traditionnel, mais les solutions de stockage en nuage ont gagné en popularité ces dernières années. Ces dernières sont plus économiques et offrent un certain degré de flexibilité. En ce qui concerne le traitement, les systèmes informatiques disponibles aujourd'hui sont à la hauteur de la vitesse, de la puissance et de l'agilité nécessaires pour répondre aux exigences de l'accès à des volumes de données aussi massifs. L'intégration des données, le contrôle de la qualité, la data governance et la préparation des données pour que les outils analytiques puissent faire leur travail sont également des paramètres nécessaires.
Des outils pour tirer le meilleur parti du big data
Le big data est ce qui alimente les efforts d'analyse avancée de notre époque, comme l'intelligence artificielle. Plus une entreprise utilise efficacement les données qu'elle collecte, plus elle peut en extraire du potentiel. Investir dans un logiciel capable de gérer et d'analyser d'énormes volumes de données, notamment en temps réel, est une étape essentielle de la gestion du big data.
MapReduce, BigTable et Hadoop : lorsque de grandes quantités de données doivent être stockées et que des moyens plus efficaces de mener des activités commerciales doivent être identifiés, des outils comme Hadoop et l'analyse basée sur le cloud sont utilisés. Ils permettent d'optimiser les processus et de réaliser des économies.
En outre, la vitesse élevée d'outils tels que Hadoop couplée à l'analytique in-memory permet d'identifier des ressources inexploitées, c'est-à-dire de nouvelles sources de données à analyser. La rapidité de capture et d'analyse des données est un grand atout pour les entreprises qui peuvent ainsi prendre des décisions rapides.
Les défis complexes nécessitent des solutions intelligentes. Les plateformes doivent donner aux organisations les moyens d'agir grâce à des interfaces simples et intuitives, afin que même les personnes les moins compétentes en informatique puissent les utiliser. La plateforme doit également être capable d'exploiter toute la gamme du big data, ce qui se traduit par des analyses précises en temps réel. La réussite d'un système réside dans sa capacité à traiter des grappes de données de plusieurs téraoctets provenant de diverses sources et à les transformer en tableaux de bord fournissant des informations utiles et des analyses de flux de travail.

Analyse du big data : aperçus
- L'analyse des big data permet de mieux comprendre les conditions actuelles du marché, le comportement d'achat des clients, la popularité des produits, etc. afin d'optimiser la planification de la fabrication ou de l'approvisionnement.
- De même, les big data permettent aux entreprises de savoir ce que leurs clients aiment, à quelle catégorie démographique appartiennent les clients payants, puis de trouver des moyens de les récompenser et de les fidéliser afin de les conserver à long terme.
- Assurer la satisfaction des clients est crucial pour la longévité de l'entreprise. Les informations fournies par le big data permettent de gérer les attentes et de concevoir des campagnes de marketing mémorables et efficaces pour différents types de clients.
- L'analyse des big data peut également servir d'indicateur de sentiment, en mesurant l'opinion des consommateurs envers votre marque, votre service ou votre produit. Cela peut être d'une grande aide dans la gestion de votre image de marque. Les informations provenant des big data peuvent contribuer à améliorer la visibilité et la popularité en ligne et à maintenir des évaluations élevées.
- Les informations fournies par l'analyse des big data aident les entreprises à innover et à redévelopper constamment leurs produits pour rester en tête de la concurrence. Elles aident à identifier la cause profonde des échecs, des problèmes et des défauts.
- Les big data permettent d'identifier des modèles, de calculer des portefeuilles de risques et d'intercepter des comportements frauduleux avant que de graves dommages soient causés.
Avantages à long terme découlant du traitement des big data
Une fois que les organisations ont investi du temps et des ressources dans l'infrastructure nécessaire au traitement des big data, elles peuvent espérer bénéficier des avantages suivants :
- Une optimisation des ressources et une planification des stocks
- Une meilleure gestion des actifs
- Une compréhension plus intuitive des profils des clients
- Une amélioration des relations avec les clients, les vendeurs et les fournisseurs
- Des délais de commande et de livraison plus courts
- Une meilleure intégration de l'ensemble de la chaîne d'approvisionnement
- Une planification stratégique plus efficace
- Un temps de réaction plus court pour résoudre les problèmes de la chaîne d'approvisionnement
- Une amélioration du service à la clientèle et une accélération des délais d'exécution
Comment les big data influent sur divers secteurs : exemples
Les big data dans le secteur de l'éducation
Les big data ont entraîné des changements majeurs dans le secteur de l'éducation, notamment en :
- Créant des programmes d'apprentissage et de développement plus personnalisés, dynamiques et interactifs
- Redéfinissant la portée des supports de cours
- Modifiant les systèmes de notation pour plus de précision
- Apportant prévision et conseil en matière de carrière
Les big data dans le secteur de l'assurance
Le secteur de l'assurance concerne non seulement les particuliers à la recherche d'une couverture d'assurance-vie, mais aussi les entreprises de différents types et tailles. Le facteur commun étant que les personnes et les organisations sont vulnérables aux périodes d'adversité, aux calamités et autres incertitudes. Par conséquent, les données dans le secteur de l'assurance peuvent se présenter sous différents formats, provenir de sources disparates et être sujettes à des changements.
Par exemple, si un client souhaite souscrire une assurance automobile s'il voyage dans un certain pays, la compagnie d'assurance peut recueillir et exploiter les données relatives aux conditions de conduite et à la sécurité routière dans ce pays, et ajuster la prime en conséquence. Elle peut également recueillir le dossier de sécurité routière de la personne et en tenir compte avant de lui présenter une police d'assurance.
En plus de cette évaluation des risques, les compagnies d'assurance peuvent également utiliser les big data pour la cartographie des menaces. Cela signifie qu'elles peuvent prendre en compte les différentes circonstances dans lesquelles un client ou une entreprise particulière pourrait subir un événement désavantageux susceptible de les amener à déposer un sinistre.
Les big data dans l'administration
Les big data se sont avérées particulièrement importantes pour les gouvernements du monde entier. Elles permettent de résoudre des problèmes complexes, d'assurer la gouvernance et d'influencer des événements majeurs à l'échelle non seulement locale, mais aussi nationale et mondiale.
Les big data ont ouvert la voie à de nouvelles possibilités de collecter et de rassembler les données accumulées, d'en extraire des informations utiles et de leur conférer une viabilité et un contexte pour divers processus organisationnels.