Cosa sono i Big Data?
Big data si riferisce alle quantità voluminose e in costante crescita di dati che un'organizzazione possiede e che non possono essere analizzati con metodi tradizionali. I big data, che comprendono sia dati strutturati che non strutturati, sono spesso la materia prima su cui le organizzazioni possono eseguire analisi ed estrarre informazioni che possono aiutarle a creare strategie di business migliori. È più di un sottoprodotto di processi e applicazioni tecnologiche. I big data sono oggi una delle risorse più importanti.
I big data possono essere costituiti da dati strutturati tradizionali, dati non strutturati o semistrutturati. Un esempio di big data non strutturati e in costante crescita sono i dati generati dagli utenti sui social media. L'elaborazione di questi dati richiede un approccio diverso rispetto ai dati strutturati, con strumenti e tecniche specializzati.
I big data sono il sottoprodotto dell'esplosione di informazioni di oggi. Tutte le aree della vita lavorativa e quotidiana contribuiscono alla crescente quantità di big data: vendita al dettaglio, immobiliare, viaggi e turismo, finanza, social media e tecnologia, ogni aspetto della nostra vita da quanti passi facciamo alle nostre storie finanziarie sono dati.
Nel 2017, si stimava che circa 3,8 miliardi di persone, circa il 47% della popolazione mondiale, usassero Internet. Il numero e la varietà di dispositivi elettronici intelligenti è salito alle stelle negli ultimi anni e continua a crescere. La nostra produzione giornaliera di dati è stimata in 2,5 quintilioni di byte e la crescita continua.
Con il numero di utenti Internet in aumento esponenziale, i dati non dormono mai.
Le cifre qui sotto aiuteranno a farsi un'idea delle dimensioni del colosso dei Big Data. Questo è ciò che accade nel regno cibernetico ogni minuto. Fai tu i conti.
- I canali meteo ricevono 18.055.555 richieste di previsioni
- Le persone effettuano 176.220 chiamate con Skype
- Gli utenti di Instagram pubblicano 49.380 foto
- Gli utenti di Netflix riproducono 97.222 ore di video
Caratteristiche dei big data
Le cinque V dei big data sono universalmente accettate:
- Volume
- Velocità
- Varietà
- Veracità
- Valore
1. Volume
Se pensiamo ai big data come a una piramide, il volume ne forma la base larga. Il volume di dati che le aziende di tutto il mondo gestiscono ha iniziato a salire alle stelle intorno al 2012, quando le organizzazioni hanno iniziato a raccogliere più di tre milioni di dati ogni giorno. Da allora, secondo un professore di MBA dell'Università Antonio de Nebrija, si stima che questo volume raddoppi circa ogni 40 mesi.
2. Velocità
Il termine "velocità" si riferisce alla velocità con cui vengono generati i dati.
Non è solo il volume dei big data ad essere una risorsa: anche la velocità con cui fluiscono, cioè la loro velocità, è importante. Più è vicina al tempo reale, meglio è in termini di vantaggio competitivo per le aziende che cercano di estrarre da esso informazioni utili e preziose.
Un esempio di questo è se un'azienda di consegne di cibo decide di comprare una campagna Google Ads sulla base dei suoi dati di vendita 45 minuti dopo l'inizio di un grande evento sportivo. Gli stessi dati avranno perso la loro rilevanza poche ore dopo.
Le tecnologie che guidano questo bisogno di dati rapidi includono tag RFID, contatori intelligenti e vari tipi di sensori.
3. Varietà
La varietà si riferisce alla gamma di fonti da cui un'azienda può acquisire i big data e alla moltitudine di formati in cui possono apparire. Alcuni esempi sono smartphone, dispositivi interni, chiacchiere di social media, dati di borsa e dati da transazioni finanziarie. La fonte deve essere particolarmente rilevante per la natura del business per cui i dati vengono raccolti. Per esempio, una società di vendita al dettaglio deve essere sintonizzata su ciò che gli utenti dicono sui social media riguardo alla sua linea di abbigliamento lanciata di recente. Un'azienda manifatturiera avrebbe meno valore incorporato nel seguire i social media.
Una varietà di dati può anche estendersi per aiutare le organizzazioni a capire i profili dei clienti e le personas. Per esempio, un'azienda potrebbe trovare utile sapere non solo quante persone aprono la loro newsletter, ma anche perché l'hanno aperta e le caratteristiche distintive del pubblico.
4. Veracità
La veridicità chiama in causa la qualità e l'accuratezza dei dati. I dati puliti sono i più affidabili. Le organizzazioni devono collegare, pulire e trasformare i loro dati attraverso i sistemi per potersi fidare di loro. Hanno bisogno di gerarchie e collegamenti multipli di dati per mantenere il controllo dei loro dati.
5. Valore
All'apice della piramide si trova il valore, la capacità di estrarre informazioni aziendali valide da una valanga di dati.
Il valore è essere in grado di prevedere quanti nuovi membri si iscriveranno al sito web, quanti clienti rinnoveranno le polizze assicurative, quanti ordini aspettarsi, e così via. Il valore è sapere chi sono i propri migliori clienti e chi cadrà fuori dalla mappa in poche settimane o mesi, per non tornare più.
Le aziende guadagnano valore attraverso la loro capacità di monetizzare le informazioni fornite dai big data. Conoscono meglio i loro clienti e continuano a fare offerte più rilevanti.

Principali tipi e fonti di big data
Dati in streaming
Sono i dati che provengono dall'Internet of Things e dai dispositivi connessi. Sono dati che fluiscono nei sistemi in ordine cronologico. Possono fluire nei sistemi IT da una moltitudine di gadget connessi come smartphone, indossabili, auto intelligenti, attrezzature industriali e dispositivi medici. I dati in streaming possono essere analizzati su base first-in o continua, analizzandoli per vedere se vale la pena conservarli per ulteriori analisi o se possono essere tranquillamente scartati.
Dati dei social media:
I milioni di interazioni quotidiane su piattaforme di social media come Facebook, Instagram, YouTube sotto forma di foto, immagini, GIF, video, voce, commenti (testo) e file audio costituiscono il repertorio dei dati dei social media. Questo è particolarmente prezioso per le vendite, l'assistenza e le campagne di marketing. La sfida sta nel fatto che sono per lo più in forma non strutturata o semistrutturata, quindi è necessaria un'ulteriore elaborazione prima di poterli analizzare.
Dati disponibili al pubblico
Si riferiscono all'enorme numero di fonti di dati aperti, compresi i portali data.gov dei principali governi mondiali.
Il resto dei big data arriva dal cloud, dai data lake, dai venditori, dai fornitori o dai clienti.
Come vengono elaborati i big data
L'elaborazione dei big data inizia con l'impostazione di una strategia per sfruttarli. Il passo successivo è quello di individuare e catalogare le sue fonti, i luoghi, i sistemi, gli utenti e i proprietari e il modo in cui confluiscono. Poi creare un'infrastruttura per immagazzinare e gestire i dati in modo da essere facilmente accessibili per l'analisi, il passo finale per facilitare il processo decisionale guidato dai dati. Questo protocollo è utile per gestire insiemi di dati strutturati tradizionali così come dati non strutturati e semistrutturati.
Quando si sviluppa una strategia di gestione dei big data, è d'obbligo tenere conto degli obiettivi aziendali attuali e futuri dal punto di vista della crescita aziendale e della tecnologia, nonché trattare i big data come qualsiasi altra risorsa aziendale di valore.
I dati possono essere memorizzati in loco in un data warehouse tradizionale, ma le soluzioni di archiviazione cloud hanno guadagnato popolarità negli ultimi anni. Sono più economiche e forniscono un certo grado di flessibilità. Per quanto riguarda l'elaborazione, i sistemi di calcolo disponibili oggi sono all'altezza della velocità, della potenza e dell'agilità necessarie per soddisfare le richieste di accesso a tali massicci volumi di dati. Integrare i dati, assicurare il controllo di qualità, fornire una governance dei dati e prepararli per consentire agli strumenti analitici di fare il loro lavoro sono altri parametri necessari.
Strumenti per ottenere il massimo dai big data
I big data sono ciò che alimenta gli sforzi di analisi avanzata della nostra epoca, come l'intelligenza artificiale. Più efficientemente un'azienda usa i dati raccolti, più potenziale può estrarre da essi. Investire in un software in grado di gestire e analizzare enormi volumi di dati, soprattutto in tempo reale, è un passo fondamentale per la gestione dei big data.
MapReduce, BigTable e Hadoop: quando grandi quantità di dati devono essere immagazzinate, e devono essere identificati modi migliori o più efficienti di condurre le attività aziendali, vengono utilizzati strumenti come Hadoop e l'analisi basata sul cloud. Questi aiutano a ottimizzare i processi per fornire vantaggi in termini di costi.
Inoltre, l'alta velocità di strumenti come Hadoop accoppiato con l'in-memory analytics aiuta a individuare risorse non sfruttate, cioè nuove fonti di dati da analizzare. La velocità di acquisizione e analisi dei dati è una grande risorsa che consente alle aziende di prendere decisioni rapide.
Le sfide complesse hanno bisogno di soluzioni intelligenti. Le piattaforme devono potenziare le organizzazioni con interfacce semplici e intuitive che garantiscano che anche i meno esperti di IT possano usarle. La piattaforma deve anche essere in grado di sfruttare l'intera gamma dei big data, il che determina analisi accurate e in tempo reale. Essere in grado di gestire cluster di dati multiterabyte da diverse fonti e trasformarli con successo in dashboard che forniscono informazioni utili e analisi del flusso di lavoro rende un sistema vincente.

Analisi dei big data: approfondimenti
- La big data analytics produce una comprensione più profonda delle attuali condizioni di mercato, del comportamento d'acquisto dei clienti, della popolarità dei prodotti e così via, per ottimizzare la pianificazione della produzione o degli acquisti.
- Allo stesso modo, i big data aiutano un'azienda a capire cosa piace ai propri clienti, in quale demografia rientrano i loro clienti paganti, e quindi a trovare modi per premiare e promuovere la loro fedeltà per mantenere i clienti a lungo termine.
- Mantenere i clienti felici è fondamentale per la longevità dell'impresa. Le informazioni fornite dai big data sono di grande aiuto nella gestione delle aspettative e nella progettazione di campagne di marketing memorabili ed efficaci per vari tipi di clienti.
- La big data analytics può anche essere un metro di opinione, misurando come i consumatori la pensano riguardo al proprio marchio, servizio o prodotto. Questo può essere di grande aiuto nella gestione dell'immagine del marchio. Le informazioni dei big data possono aiutare a migliorare la visibilità e la popolarità online e a mantenere alte le valutazioni.
- Le informazioni fornite dai big data analytics aiutano le aziende a innovare costantemente e a sviluppare nuovamente i loro prodotti per restare davanti alla concorrenza. Aiutano a identificare la causa principale di fallimenti, problemi e difetti.
- I big data aiutano a individuare modelli, calcolare i portafogli di rischio e intercettare comportamenti fraudolenti prima che siano provocati danni seri.
Benefici a lungo termine derivanti dall'elaborazione dei big data
Una volta che le organizzazioni hanno investito tempo e risorse nell'infrastruttura necessaria per elaborare i big data, possono aspettarsi di ottenere i seguenti benefici:
- Ottimizzazione delle risorse e pianificazione dell'inventario
- Migliore gestione delle risorse
- Comprensione più intuitiva dei profili dei clienti
- Miglioramento delle relazioni con clienti, venditori e fornitori
- Tempi più brevi tra ordine e consegna
- Migliore integrazione in tutta la catena di approvvigionamento
- Pianificazione strategica più efficace
- Tempi di reazione più brevi per affrontare i problemi della catena di approvvigionamento
- Servizio clienti migliorato e tempi di consegna più rapidi
Come i big data stanno influenzando vari settori: esempi
I big data nel settore dell'istruzione
I big data hanno guidato grandi cambiamenti nel settore dell'istruzione, in particolare nel:
- Creare programmi di apprendimento e sviluppo più personalizzati, dinamici e interattivi
- Ridefinire la portata dei materiali del corso
- Modificare i sistemi di classificazione per una maggiore precisione
- Previsione e consulenza di carriera
I big data nel settore assicurativo
Il settore assicurativo è rilevante non solo per gli individui che cercano una copertura per la vita, ma anche per le imprese di vari tipi e dimensioni. Il fattore comune è che sia le persone che le organizzazioni sono vulnerabili a tempi di avversità, calamità e altre incertezze. Di conseguenza, i dati nel settore assicurativo possono arrivare in una varietà di formati, da fonti disparate e sono soggetti a cambiamenti.
Per esempio, se un cliente è interessato ad acquistare un'assicurazione auto se viaggia in un certo paese, la compagnia di assicurazione può raccogliere ed eseguire i dati per le condizioni di guida e la sicurezza stradale in quel paese, e regolare il premio di conseguenza. Possono anche raccogliere il record di sicurezza di guida della persona e tenerne conto prima di presentargli una polizza per l'acquisto.
Oltre a tale valutazione del rischio, le compagnie di assicurazione possono anche utilizzare i big data per la mappatura delle minacce. Questo significa che possono prendere in considerazione le diverse possibilità in cui le cose potrebbero andare male con un particolare cliente o una particolare azienda in riferimento a un'eventuale richiesta di risarcimento.
Big data nel governo
I big data hanno dimostrato di essere particolarmente impattanti per i governi di tutto il mondo. Sono decisivi per affrontare questioni complesse, garantire la governance e influenzare i grandi eventi non solo a livello locale, ma anche su scala nazionale e globale.
I big data hanno inaugurato un'enorme nuova opportunità per raccogliere e mettere insieme i dati accumulati ed estrarre da essi informazioni utili, dotandoli di vitalità e contesto per vari processi organizzativi.