Cos'è la qualità dei dati?
La qualità dei dati è quando i dati si adattano allo scopo per cui sono stati pensati. I dati sono anche considerati di alta qualità quando rappresentano accuratamente i costrutti del mondo reale.
Per comprendere questo, bisogna considerare i dati come la pietra miliare di una gerarchia costruita su di essi. Sopra le fondamenta dei dati, vengono le informazioni, che sono dati inseriti in un contesto. Dalle informazioni attuabili nasce la conoscenza, che si sviluppa in saggezza quando viene applicata. Dati di cattiva qualità si tradurranno in una cattiva qualità dell'informazione e questa si sposta verso l'alto nella gerarchia, provocando decisioni di business sbagliate.
Quando i dati si adattano a uno scopo previsto e rappresentano costrutti del mondo reale, sono considerati di alta qualità. Tuttavia, ciò può avere una natura contraddittoria.
Prendiamo ad esempio il registro dei dati master di un cliente che usa un prodotto dell'azienda. I dati nel registro principale possono essere sufficienti per emettere una fattura al suddetto cliente, ma la mancanza di dettagli precisi sull'indirizzo e sul numero di telefono può non essere l'ideale per l'ufficio del servizio clienti, e questo può comportare un problema aziendale.
Idealmente, il registro dei dati master dovrebbe servire a più scopi. Per questo, è necessario un allineamento del mondo reale in cui i dati si adattano al loro scopo e possono essere utilizzati anche per altri obiettivi aziendali. Ciò dovrebbe essere svolto senza un bisogno sproporzionato di risorse per raccogliere i dati. In altre parole, è necessario un equilibrio tra i due aspetti della definizione di qualità dei dati.
L'errore umano è in cima alla lista come motivo di imprecisione che genera dati di cattiva qualità. Lavorare per correggere i dati di bassa qualità richiede tempo, sforzi erculei e un mix ideale di persone, processi migliori e tecnologie. Altre ragioni di una qualità dei dati inferiore includono una mancanza di comunicazione tra i reparti e strategie di dati inadeguate. Affrontare questi problemi dipende da una gestione proattiva.

Importanza della qualità dei dati
Nella gerarchia di un'azienda, non c'è dubbio che i dati di buona qualità lavorino a favore della redditività. Tuttavia, restano le domande su chi è responsabile di assicurare che la qualità dei dati rimanga costantemente buona e come questi sforzi saranno finanziati in un'organizzazione. La qualità dei dati deve essere testata a un livello dettagliato per comprenderne l'impatto - positivo o negativo - su un'impresa, e questo può essere piuttosto difficoltoso. L'importanza di mettere in atto dei protocolli per assicurare la qualità dei dati può essere osservata nei seguenti esempi:
- Per l'ufficio marketing della propria azienda, il problema dei duplicati nei dati può provocare una spesa eccessiva del budget di marketing. Per esempio, lo stesso database può ricevere materiali di marketing con leggere variazioni nel nome di un potenziale cliente. Questo può non solo frustrare il cliente, ma creare interi doppioni nei profili dei clienti.
- Il reparto vendite online potrebbe spingere un'agenda alla creazione di una decisione di acquisto self-service. Ma con la mancanza di dati di prodotto completi all'interno dei database esistenti e con il modo in cui i dati di prodotto sono condivisi tra i partner di prodotto, la qualità dei dati può essere un compito difficile da realizzare.
- Per la parte relativa alla catena di approvvigionamento della tua attività, in cui potresti cercare di automatizzare i processi, è difficile ottenere dati di localizzazione affidabili perché gli stessi standard e la stessa precisione con i dati di localizzazione non possono essere applicati a tutte le sedi servite.
- Per i reparti che dipendono dalla relazione finanziaria, il problema di ricevere una vasta gamma di risposte a una singola domanda accade a causa di dati incoerenti, mancanza di dati aggiornati o mancanza di parametri di dati chiari.
Tutto questo si unisce per creare un impatto drasticamente negativo sugli aspetti aziendali di un'attività e rende difficile raggiungere gli obiettivi aziendali. La maggior parte di questi obiettivi sono comuni a una vasta gamma di imprese.
Senza una buona qualità dei dati, le imprese:
- Non saranno in grado di sfruttare le nuove opportunità di mercato. Questo può danneggiare i loro margini di profitto e ostacolare la loro traiettoria di crescita.
- Non saranno in grado di introdurre misure di riduzione dei costi. La mancanza di dati di buona qualità richiede lo svolgimento di molte ispezioni e correzioni manuali prima di poterli utilizzare. L'automazione dei processi diventa dunque difficile senza dati completi e coerenti.
- Non saranno in grado di soddisfare i requisiti di conformità perché sarà sempre più difficile senza dati di buona qualità. I requisiti coprono aspetti come le regolamentazioni sulla privacy e la protezione dei dati, così come i requisiti di salute e sicurezza. Coprono anche aspetti di restrizioni e linee guida finanziarie. Avere dati di buona qualità è essenziale per soddisfare gli obiettivi di conformità.
- Avranno difficoltà a fare uso di strumenti di analisi predittiva sugli asset di dati aziendali. Questo può influenzare sia le decisioni a breve che a lungo termine, rendendo le cose estremamente difficili per un'azienda in termini di progresso. Le sfide affrontate derivano da problemi come duplicazione dei dati, dati incompleti, incoerenza e imprecisione delle previsioni.

I benefici dei dati di qualità
Le organizzazioni che investono nella creazione di dati di qualità sono in grado di sfruttare i dati per prendere decisioni aziendali migliori.
I dati di alta qualità facilitano un migliore processo decisionale
Il mercato oggi è naturalmente incentrato sul consumatore. Con dati di alta qualità, le aziende saranno in grado di facilitare decisioni migliori. Per esempio, se un'analisi dei dati mostra che le persone hanno iniziato a passare sempre più tempo fuori — a fare acquisti e a cenare — il giovedì piuttosto che il solito venerdì, allora le aziende possono scegliere di rimanere aperte più a lungo o di rendere disponibili offerte uniche per condurre gli affari verso se stesse.
Migliori collaborazioni di squadra
Quando i molti reparti di un'organizzazione hanno accesso costante agli stessi dati di alta qualità, il risultato è una comunicazione di gran lunga migliore e più efficace. Questo rende più facile per tutti i membri del team rimanere allineati in termini di priorità, della messaggistica che esce, così come del branding. Tutto questo contribuisce a garantire risultati migliori.
Comprendere meglio il cliente
Con dati di buona qualità, le aziende sono in grado di valutare meglio gli interessi e le esigenze dei clienti. Questo aiuta un'organizzazione a crescere creando prodotti migliori che sono guidati dai bisogni dei clienti. Le campagne create possono quindi essere condotte in base ai desideri dei consumatori e al feedback diretto dei dati, non solo alle ipotesi plausibili.
Come si valuta la qualità dei dati?
Dato il fatto che le organizzazioni sono destinate a perdere considerevolmente se i processi aziendali si basano su dati di cattiva qualità, diventa necessario che i titolari e i dirigenti comprendano come la qualità dei dati può essere valutata. Questo compito include la configurazione di parametri e processi che valutano la qualità dei dati. Le aziende dovranno lavorare per far sì che i loro dati abbiano un alto livello di valutazione sia oggettiva che soggettiva. Affinché le aziende migliorino la qualità dei dati, devono:
- Valutare attentamente i parametri di qualità dei dati sia oggettivi che soggettivi
- Analizzare i risultati e accertare le cause di eventuali discrepanze
- Lavorare sui modi per migliorare
Valutazioni di dati soggettivi
Con le valutazioni soggettive, le organizzazioni stanno misurando come le parti interessate, gli analisti, coloro che raccolgono i dati e altre parti percepiscono la qualità dei dati. Se una qualsiasi delle parti interessate prende una decisione sulla base dei dati che riceve, ma scopre che sono imprecisi o incompleti, allora la sua decisione sarà influenzata. Questo deve essere preso in considerazione quando si cerca di trovare lacune nella qualità dei dati.
Valutazioni oggettive dei dati
Le valutazioni oggettive della qualità dei dati prendono in esame le indicazioni misurabili, che sono registrate all'interno di un set di dati e poi valutate da due punti di vista:
- Le sue prestazioni in un compito specifico
- Da un punto di vista che è un set di dati basato su parametri e può essere utilizzato indipendentemente
Per impostare i parametri per la valutazione dei dati oggettivi, le organizzazioni possono lavorare sui principi per sviluppare indicatori chiave di prestazione (KPI) che corrispondono alle loro esigenze specifiche. Questi sono conosciuti come forme funzionali. Ci sono tre modi in cui le forme funzionali sono misurate per la qualità:
- Rapporto semplice: qui si misura il numero totale di risultati desiderati con il totale dei risultati possibili. L'intervallo è generalmente compreso tra 0 e 1, con 1 che è il risultato preferito. Sia la completezza che la coerenza possono essere misurate con questo rapporto. Il tranello qui è che entrambe le dimensioni possono essere misurate in diversi modi e le organizzazioni dovranno avere dei criteri prestabiliti per ottenere le misure migliori.
- Minimo o massimo: creata per gestire più variabili di qualità dei dati, questa forma funzionale ha il minimo come numero conservativo e il massimo ad un numero più liberale. Le variabili, come il livello accurato dei dati, sono segnate dal minimo. Aspetti come la tempestività e/o l'accessibilità sono rappresentati dal massimo.
- Media ponderata: usata come alternativa al minimo, può essere usata quando un'organizzazione sta cercando di indagare e comprendere il valore che ogni variabile porta all'equazione.
Una volta che un'organizzazione ha valutato tutti i parametri oggettivi e soggettivi della qualità dei dati, può passare a prendere misure che aiutino a snellire i suoi processi. Prendere tempo per esaminare i processi e prendere decisioni oggettive è una perdita di tempo se le azioni intraprese non sono efficaci e svolte coerentemente.
Come migliorare la qualità dei dati
Per qualsiasi organizzazione, il miglioramento della qualità dei dati riguarda il giusto mix di persone qualificate, processi intelligenti e tecnologie accurate. Tutto questo, combinato con una gestione proattiva di alto livello può aiutare a migliorare la qualità dei dati in modo sostanziale.
Dimensioni della qualità dei dati
Quando si lavora sul miglioramento della qualità dei dati, il compito principale è lavorare sul miglioramento della gamma di dimensioni della qualità dei dati. La dimensione più affrontata è quella dell'unicità dei dati master del cliente. Questo database soffre spesso di duplicazione laddove due o più righe di input possono avere gli stessi dati di un'entità (essendo il cliente). Ci sono numerosi modi per assicurare che i dati non siano duplicati, sia al punto di ingresso che con tecniche di deduplicazione dei dati già memorizzati nei database.
Nel caso dei dati master dei prodotti, la dimensione dell'unicità non è un grosso problema da affrontare. Piuttosto, è quello della completezza. La ragione principale della mancanza di completezza è che diverse categorie di prodotti avranno requisiti diversi e non tutti sono compilati. In molti casi, la conformità dei dati dei prodotti ha una relazione diretta con le posizioni geografiche, per esempio le misure di unità. Mentre gli Stati Uniti misurano la lunghezza in pollici, il resto del mondo la misura in centimetri.
Lavorare sui dati master per la localizzazione comporta il problema della mancanza di un modello di inserimento coerente. Con così tanti formati diversi usati in tutto il mondo, standardizzare gli inserimenti può essere estremamente difficile.
Aspetti da considerare sulle intersezioni
A un certo punto, i domini della posizione e del cliente si intersecheranno e la dimensione della precisione sarà difficile da mantenere. Questo perché diversi casi d'uso utilizzano diverse dimensioni di precisione per la posizione.
Per consentire che questa intersezione avvenga con successo, è importante comprendere i desideri dei clienti, in base ai quali i dettagli relativi a un prodotto possono essere condivisi con loro. Questo aiuterà l'intersezione dei domini dei dati master dei clienti e dei prodotti.
Sei dimensioni primarie per gli standard base di qualità dei dati
I criteri possono variare da un progetto all'altro, ma la base dovrebbe generalmente rimanere la stessa. I dati di alta qualità avranno sempre questi sei criteri fondamentali.
- Completezza: cerca quali campi essenziali devono essere compilati perché un set di dati sia considerato completo. Nel caso di un database di clienti, nome e indirizzo saranno assolutamente d'obbligo, ma a seconda del prodotto o servizio, il genere potrebbe non esserlo. Sempre più spesso si tende a rimuovere Sig./Sig.ra, non solo per essere più inclusivi verso coloro che non rientrano in nessuna categoria, ma perché semplicemente non è necessario saperlo.
- Coerenza: assicurati che tutte le iterazioni di ogni dato siano le stesse in ogni rapporto, in tutti i risultati di analisi o fogli di calcolo che sono compilati e utilizzati. Cerca le incongruenze, poiché queste possono comportare dati di cattiva qualità in futuro. Un buon software dovrebbe aiutare a rimuovere o identificare le incongruenze.
- Accuratezza: la coerenza è necessaria per assicurare un valore unico in tutti i canali. L'accuratezza, d'altra parte, fa sì che questi valori siano corretti e riflettano la realtà che i dati rappresentano. Se questo è un problema, l'uso della robotica per inserire i dati può eliminare l'errore umano.
- Formato: assicurarsi che i formati di inserimento dei dati siano coerenti deve essere la pietra angolare dell'inserimento dei dati. Crea un formato unico e attieniti ad esso, anche per i più piccoli dettagli come l'anno di fabbricazione. Formato data americano o inglese? Tutte maiuscole?
- Tempistica: l'efficacia di qualsiasi dato è quanto sia attuale e pertinente nel momento in cui viene estratto per essere utilizzato dall'utente finale. Quando i dati sono attuali, disponibili per chi prende le decisioni al momento giusto e sono la versione più aggiornata di se stessi, la tempestività può essere assicurata.
- Integrità: questo è un criterio che accerta se un set di dati è conforme alle regole e agli standard stabiliti dall'organizzazione. I valori mancanti possono disturbare l'efficacia dei dati.
Assicurarsi che queste dimensioni siano chiaramente rispettate darà alle organizzazioni set di dati accurati, di alta qualità e indispensabili per un processo decisionale di qualità.