Cos'è un Data Scientist?
Quella del data scientist è una professione che richiede una serie di competenze tecniche e di dominio per gestire e analizzare i dati per risolvere problemi di business. I data scientist in parte matematici, in parte analisti di business e in parte informatici. Un buon Data Scientist può vedere tendenze e modelli nei dati e sa come usare i dati per produrre risultati utili e utilizzabili. I data scientist sono in prima linea nelle aziende moderne, trasformando il modo di lavorare.
Storia dei Data Scientist
Nel 2001, un informatico, William S. Cleveland, ha scritto un articolo 'Data Science: An Action Plan for Expanding the Technical Area of Statistics'. Questo articolo introduceva la Data Science come una disciplina di statistica applicata. Questo accadeva solo 20 anni fa, e il mondo della tecnologia e degli affari si è mosso rapidamente da allora.
Poiché questo è un percorso di carriera relativamente nuovo, gli attuali Data Scientist provengono da vari background e specialità. Molti iniziano la loro carriera come statistici, matematici o data analyst. Ma man mano che l'accesso ai computer, l'intelligenza artificiale (IA) e gli strumenti di apprendimento dei dati sono diventati comuni, il ruolo si è evoluto. Un Data Scientist non è più confinato alla divisione informatica; è diventato parte integrante del business complessivo. A causa della sua espansione e dell'influenza fondamentale sul business, il ruolo del data scientist richiede una persona con un pensiero logico e innovativo per essere in grado di tradurre le idee sui dati in strategia aziendale.
Di quali qualifiche ha bisogno un Data Scientist?
Negli ultimi dieci anni, gli istituti di istruzione superiore hanno sviluppato corsi specifici per i Data Scientist. Coloro che desiderano lavorare nel settore possono ottenere una laurea o un master in Data Science in molte università.
I corsi che i data scientist seguono coprono tipicamente modellazione statistica, data management, data visualization, machine learning, ingegneria del software, etica dei dati, progettazione della ricerca ed esperienza utente. Possono apprendere SQL, Python, Perl e una serie di altri linguaggi di programmazione come R. Acquisiscono familiarità con Hadoop, Pig, Spark, Hive e MapReduce.
Tuttavia, con più software open-source che diventano disponibili e più strumenti di Data Science commercializzati, ciò che le persone imparano oggi potrebbe presto diventare obsoleto. Pertanto, i Data Scientist devono essere agili e continuare ad apprendere nuove competenze e tecniche all'interno del settore.

I Data Scientist hanno bisogno di più di una laurea
Un eccellente Data Scientist dovrebbe essere curioso, sempre alla ricerca di nuove informazioni e nuovi modi di pensare alle sfide aziendali. Un forte senso di intuizione e l'abitudine di aver bisogno di prove sono anche caratteristiche eccellenti che deve avere un data scientist. Devono essere abbastanza creativi da trovare risposte dove non ce n'erano, cercando continuamente idee e risultati.
I Data Scientist hanno anche bisogno di un profondo senso di conoscenza del business del dominio. Conoscere i dati e la programmazione è una cosa, avere l'intuizione di creare strategie di business da queste idee ne è un'altra. I data scientist dovrebbero essere in grado di comprendere i rischi e le opportunità per il business, così pure di utilizzare i dati per fornire strategie per la crescita del business. Una cosa è sapere che la gente compra di più con un certo tipo di tempo atmosferico, ma come può un'azienda trarre vantaggio da questo tipo di informazioni? Il ruolo del data scientist è quello di capire e rispondere a domande come questa, che spingono continuamente il business verso nuove vette.
Un grande data scientist ha anche bisogno di eccellenti capacità di comunicazione. Essere in grado di riferire agli stakeholder e ai manager e spiegare chiaramente i risultati delle analisi. Essere in grado di spiegare dove i dati erano incompleti, e cosa è necessario per risolverli. Convincere e persuadere sulla migliore linea d'azione fondata su quei risultati. I nuovi programmi e le tecniche cambieranno, ma essere in grado di pensare criticamente e avere buone capacità quantitative, specifiche del dominio, sarà sempre richiesto.
Cosa fa un Data Scientist?
Un data scientist prende i dati, sviluppa ipotesi e inferenze, e poi usa il machine learning per individuare modelli, relazioni e tendenze all'interno di quei dati. In un dato giorno, potrebbero essere:
- Analisi dei set di dati
- Dati di pulizia
- Costruire dashboard e rapporti
- Visualizzare i dati
- Realizzare inferenze statistiche
- Sviluppo di modelli di apprendimento statistico
- Creazione di modelli predittivi complessi
- Utilizzo di strumenti statistici
- Comunicare i risultati dell'analisi alle parti interessate
- Convincere i decisori
Le grandi aziende retail possono produrre fino a 40 petabyte di dati ogni giorno. I loro data scientist usano questi dati per prevedere una serie di risultati, tra cui quando e dove la gente compra determinati articoli. Questo permette loro di pianificare eventi e vendite per ottenere il massimo da tali vendite, fissando i prezzi in modo da ottenere il massimo profitto, ma anche spostando la maggior quantità di stock.
I data scientist lavorano solitamente in team per estrarre i big data alla ricerca di informazioni pertinenti. Possono anche consigliare il management su che tipo di dati dovrebbero essere raccolti, come dovrebbero essere analizzati e i risultati di tale interpretazione. Uno studio del 2017 ha mostrato che l'80% del tempo di un data scientist è impiegato nel data management. Trovarli, pulirli e organizzarli. Questo lascia solo il 20 per cento del loro tempo di lavoro per eseguire effettivamente l'analisi. Tuttavia, anche questo sta cambiando: con l'avvento del machine learning automatizzato e del deep learning, i data scientist stanno scoprendo di avere più tempo per l'analisi, poiché questi strumenti sono diventati più automatizzati e hanno assunto gran parte della pulizia e organizzazione dei dati, lasciando ai data scientist più tempo per l'analisi.
Perché il ruolo dei data scientist è così importante?
Per un'azienda, un data scientist ha un valore inestimabile. Essi prendono milioni, anche miliardi di punti di dati e li trasformano in informazioni cruciali per fare previsioni su un'organizzazione che potrebbero salvare o far crescere un'azienda. Alcuni esempi di data scientist per settore includono:
Ottimizzazione del marketing
I data scientist rappresentano una parte cruciale del marketing. Per esempio, un data scientist può produrre una serie di trigger che avvisano l'azienda che i loro clienti sono ad alto rischio di abbandono. Nel marketing, è ben noto che il costo di trovare un nuovo cliente supera enormemente il costo di mantenere quello esistente. I trigger impostati dal data scientist permettono all'azienda di intervenire e apportare modifiche o parlare con il cliente per trattenerlo.
Sanità
Questo è un campo ampio con enormi opportunità per i data scientist. Dalla gestione dei turni e del personale a livelli ottimali all'identificazione di quali pazienti sono ad alto rischio di non rispettare gli ordini del medico, un data scientist può trovare migliaia di opportunità per migliorare le pratiche aziendali e gli esiti sanitari.
Fraud Detection
I settori assicurativo e bancario stanno risparmiando miliardi di dollari ogni anno utilizzando i data scientist per individuare i rischi di frode. Per esempio, quando un cliente presenta domanda per un prestito, vengono raccolti una serie di dati su di lui. Queste informazioni vengono elaborate e confrontate con le informazioni note sui precedenti casi di frode. Quasi immediatamente, il sistema può consigliare se questa persona è un rischio.
Come diventare un Data Scientist
Se hai un cervello logico, sai maneggiare i numeri, ti piace lavorare con i computer e hai una profonda comprensione del business, allora un ruolo come data scientist potrebbe essere il lavoro dei tuoi sogni.
Il primo passo è ottenere una laurea in informatica, statistica o un campo correlato. Questa laurea ti doterà di competenze in:
- Matematica, in particolare statistica
- Codifica
- Database, data lake e storage distribuito
- Tecniche di pulizia dei dati
- Visualizzazione dati e competenze di reporting
Una laurea di primo livello ti dà una conoscenza di base, ma man mano che il campo cresce saranno richieste più qualifiche o specializzazioni. Considera un master in dati o in un campo correlato, e inizia a scavare in un dominio di business specifico che ti interessa.
Una volta ottenute le qualifiche, fare esperienza nel campo di interesse è il passo successivo. L'assistenza sanitaria, il marketing, il governo o il business offrono tutti ottime prospettive di specializzazione. Mentre le competenze dei data scientist possono essere insegnate, la comprensione delle relazioni tra i dati e le implicazioni della vita reale richiede esperienza e tempo trascorso nel business.

Sfide per i Data Scientist
In parte a causa del fatto che si tratta di un nuovo settore, i data scientist stanno affrontando alcune sfide. È un settore dominato dagli uomini, e come molte carriere STEM (scienza, tecnologia, ingegneria e matematica), le donne a volte affrontano ostacoli extra per entrare e mantenere la loro carriera. Nel 2019, solo il 18% dei data scientist erano donne. Questa mancanza di diversità sta iniziando a creare problemi nel campo. Gli algoritmi sono creati da esseri umani e sono suscettibili di biad. Ad esempio, nel settore bancario, il fatto che una donna da sola richieda un prestito sarà un fattore negativo ai fini della concessione. Tuttavia, i dati mostrano che le donne sono migliori degli uomini nel pagare i prestiti. Le banche potrebbero perdere i loro migliori clienti e le donne la sicurezza e l'indipendenza finanziaria. Avere una forza lavoro diversificata aiuterà a combattere questi errori e bias.
Poiché si tratta di un nuovo settore, deve anche affrontare la problematica di un vocabolario coerente e di standard di pratica. Ci si aspetta che gli standard debbano arrivare come un consenso tra le parti interessate, i data scientist stessi e i legislatori, ma nessuno è stato ancora formato.
C'è anche una spinta verso un'IA spiegabile che possa essere interpretata facilmente. I leader di pensiero ritengono che le previsioni non dovrebbero rappresentare solo una cifra estratta dal nulla, ma piuttosto si dovrebbe essere in grado di tracciare e spiegare facilmente la logica dietro i modelli di machine learning .
Prospettive attuali per i Data Scientist
Come la maggior parte delle carriere STEM, i Data Scientist sono molto ricercati e apprezzati. Attualmente, c'è una carenza di Data Scientist qualificati con competenze analitiche appropriate. Con aspettative di stipendio più alte della media, un mercato in rapida crescita e una maggiore comprensione del loro valore, le opzioni di impiego per i Data Scientistsono eccellenti. Nel 2018, c'era una carenza di 151.000 Data Scientist, il che lo rende un campo sicuro e in crescita.
In particolare, le persone provenienti da gruppi sottorappresentati sono incoraggiate a entrare in questo campo. Con alcune università che offrono incentivi per questi gruppi per unirsi ai programmi di data science e le aziende che riconoscono sempre più che la diversità è necessaria per ottenere risultati non distorti, rappresenta un'opzione di lavoro attraente e stabile.