Was ist Big Data?
Big Data bezieht sich auf die umfangreichen und ständig wachsenden Datenmengen einer Organisation, die nicht mit herkömmlichen Methoden analysiert werden können. Big Data, zu dem sowohl strukturierte als auch unstrukturierte Datentypen gehören, sind häufig der Rohstoff für Unternehmen, mit dem sie Analysen durchführen und Erkenntnisse gewinnen, die ihnen dabei helfen können, bessere Geschäftsstrategien zu entwickeln. Es ist mehr als ein Nebenprodukt technologischer Prozesse und Anwendungen. Big Data ist heute eines der wichtigsten Ressourcen.
Big Data kann aus traditionellen strukturierten Daten, unstrukturierten oder semistrukturierten Daten bestehen. Ein Beispiel für unstrukturiertes – und ständig wachsendes – Big Data sind die nutzergenerierten Daten in sozialen Medien. Die Verarbeitung solcher Daten erfordert einen anderen Ansatz als strukturierte Daten in Verbindung mit speziellen Tools und Techniken.
Big Data ist das Nebenprodukt der Informationsexplosion von heute. Alle Bereiche des Geschäfts und des Alltags tragen zum Wachstum von Big Data bei: Einzelhandel, Immobilien, Reisen und Tourismus, Finanzen, soziale Medien bis hin zu Technologie. Jeder Aspekt unseres Lebens, von den vielen Schritten, die wir bis hin zu unserer Finanzentwicklung unternehmen, sind Daten.
Im Jahr 2017 nutzten schätzungsweise rund 3,8 Milliarden Menschen, rund 47 % der Weltbevölkerung, das Internet. Die Anzahl und Vielfalt der intelligenten elektronischen Geräte ist in den letzten Jahren in die Höhe geschossen und wachsen weiter. Unsere täglichen Ausgabedaten werden auf 2,5 Trillionen Byte geschätzt und sie nehmen weiter zu.
Da die Zahl der Menschen, die das Internet nutzen, exponentiell steigt, schlafen Daten nie.
Die folgenden Abbildungen helfen dabei, einen Überblick über die Größe des Big-Data-Giganten zu werfen. Das passiert jede Minute in der Cyberwelt. Rechnen Sie selbst nach.
- Wetterkanäle erhalten 18.055.555 Vorhersageanfragen
- Menschen tätigen 176.220 Anrufe mit Skype
- Instagram-Nutzer posten 49.380 Bilder
- Netflix-Benutzer streamen 97.222 Stunden Video
Eigenschaften von Big Data
Die fünf Vs von Big Data sind allgemein anerkannt:
- Volumen
- Schnelligkeit
- Vielfalt
- Veracity (Wahrhaftigkeit)
- Preisleistungsverhältnis
1. Volume (Datenmenge)
Wenn wir uns Big Data als Pyramide vorstellen, ist die Datenmenge die breite Basis. Die Datenmenge, die Unternehmen auf der ganzen Welt verwalten, stieg um 2012 sprunghaft an, als Unternehmen täglich mehr als drei Millionen Daten sammelten. Seitdem wird sich diese Menge laut einem MBA-Professor an der Universität Antonio de Nebrija schätzungsweise alle 40 Monate verdoppeln.
2. Velocity (Geschwindigkeit)
Der Begriff „Velocity“ bezieht sich auf die Geschwindigkeit, mit der Daten generiert werden.
Es ist nicht nur die Menge der Big Data, die von Vorteil sein kann: wie schnell sie fließen, also ihre Geschwindigkeit, ist auch wichtig. Je näher es an der Echtzeit ist, desto besser ist der Wettbewerbsvorteil für Unternehmen, die umsetzbare und wertvolle Erkenntnisse daraus gewinnen möchten.
Ein Beispiel dafür ist, ob ein Lebensmittellieferant aufgrund seiner Verkaufsdaten 45 Minuten nach Beginn eines großen Sportereignisses beschließt, eine Google-Ads-Kampagne zu kaufen. Dieselben Daten werden einige Stunden später an Relevanz verloren haben.
Zu den Technologien, die diesen Bedarf an schnellen Daten fördern, gehören RFID-Tags, intelligente Messung und verschiedene Arten von Sensoren.
3. Variety (Vielfalt)
Vielfalt bezieht sich auf das Spektrum der Quellen, aus denen ein Unternehmen Big Data beziehen kann, und auf die Vielzahl von Formaten, in denen es auftreten kann. Dazu gehören Orte wie Smartphones, interne Geräte, Chats in sozialen Medien, Börsentickerdaten und Daten aus Finanztransaktionen. Die Quelle muss für die Art des Unternehmens, für das die Daten erhoben werden, besonders relevant sein. Zum Beispiel muss ein Einzelhandelsunternehmen darauf eingestellt sein, was Benutzer in den sozialen Medien über seine kürzlich eingeführte Bekleidungslinie sagen. Ein Fertigungsunternehmen würde weniger Wert darauf legen, soziale Medien zu verfolgen.
Eine Vielzahl von Daten kann auch erweitert werden, um Unternehmen dabei zu helfen, Kundenprofile und Personen zu verstehen. Beispielsweise wäre es für ein Unternehmen hilfreich, nicht nur zu wissen, wie viele Personen seinen Newsletter öffnen, sondern auch, warum sie ihn geöffnet haben und welche Merkmale die Zielgruppe aufweist.
4. Veracity (Wahrhaftigkeit)
Die Wahrhaftigkeit stellt die Qualität und Genauigkeit der Daten in Frage. Saubere Daten sind am vertrauenswürdigsten. Unternehmen müssen ihre Daten systemübergreifend verbinden, bereinigen und transformieren, um ihnen zu vertrauen. Sie benötigen Hierarchien und mehrere Datenverknüpfungen, um die Kontrolle über ihre Daten zu behalten.
5. Value (Wert)
An der Spitze der Pyramide steht der Wert, die Fähigkeit, tragfähige Geschäftseinblicke aus der Datenlawine zu extrahieren.
Der Wert ist in der Lage, vorherzusagen, wie viele neue Mitglieder der Website beitreten, wie viele Kunden Versicherungspolicen erneuern werden, wie viele Bestellungen zu erwarten sind und so weiter. Wert bedeutet zu wissen, wer die besten Kunden sind und wer in ein paar Wochen oder Monaten verschwindet und nie zurückkehrt.
Unternehmen gewinnen an Wert durch ihre Fähigkeit, die von Big Data gelieferten Erkenntnisse zu monetarisieren. Sie lernen ihre Kunden besser kennen und machen weiterhin relevantere Angebote.

Haupttypen und Quellen von Big Data
Streaming-Daten
Das sind die Daten, die aus dem Internet der Dinge und verbundenen Geräten stammen, also Daten, die in chronologischer Reihenfolge in Systeme fließen. Sie können aus einer Vielzahl verbundener Geräte wie Smartphones, Wearables, Smart Cars, Industrieanlagen und medizinischen Geräten in IT-Systeme gestreamt werden. Streaming-Daten können zuerst oder kontinuierlich analysiert werden, indem sie gescannt werden, um festzustellen, ob es sich lohnt, sie für die weitere Analyse zu speichern, oder ob sie sicher verworfen werden können.
Social-Media-Daten:
Die Millionen von täglichen Interaktionen auf Social-Media-Plattformen wie Facebook, Instagram, YouTube in Form von Bildern, GIFS, Videos, Sprache, Kommentaren (Text) und Sounddateien bilden das Repertoire an Social-Media-Daten. Dies ist besonders wertvoll für Vertriebs-, Support- und Marketingkampagnen. Die Herausforderung besteht darin, dass sie hauptsächlich in unstrukturierter oder semistrukturierter Form vorliegen, sodass zusätzliche Verarbeitung erforderlich ist, bevor sie analysiert werden können.
Öffentlich verfügbare Daten
Dies bezieht sich auf die enorme Anzahl offener Datenquellen, einschließlich der data.gov-Portale der wichtigsten Regierungen der Welt.
Der Rest der Big Data kommt aus der Cloud, Data Lakes, Anbietern, Lieferanten oder Kunden.
Wie Big-Data-Daten verarbeitet werden
Die Verarbeitung von Big-Data-Daten beginnt mit der Entwicklung einer Strategie für ihre Nutzung. Der nächste Schritt besteht darin, die Quellen, Standorte, Systeme, Benutzer und Eigentümer sowie deren Einflussmöglichkeiten zu identifizieren und zu katalogisieren. Die Entwicklung einer Infrastruktur zum Speichern und Verwalten der Daten, die für Analysen leicht zugänglich sind, ist der letzte Schritt zur Erleichterung der datenbasierte Entscheidungsfindung. Dieses Protokoll ist nützlich, um traditionelle strukturierte Datensätze sowie unstrukturierte und semistrukturierte Daten zu verwalten.
Bei der Entwicklung einer Big-Data-Managementstrategie ist es unerlässlich, aktuelle und zukünftige Geschäftsziele sowohl vom Standpunkt des Geschäftswachstums als auch vom technologischen Standpunkt aus zu betrachten und Big Data wie jedes andere wertvolle Geschäftsvermögen zu behandeln.
Daten können entweder vor Ort in einem herkömmlichen Data Warehouse gespeichert werden, aber Cloud-Speicherlösungen haben in den letzten Jahren an Popularität gewonnen. Sie sind wirtschaftlicher und bieten ein gewisses Maß an Flexibilität. In puncto Verarbeitung entsprechen die heute verfügbaren Computersysteme der Geschwindigkeit, Leistung und Agilität, die erforderlich sind, um den Anforderungen des Zugriffs auf diese riesigen Datenmengen gerecht zu werden. Die Integration von Daten, die Sicherstellung der Qualitätskontrolle, die Bereitstellung von Datenverwaltung und von Analysetools für ihre Arbeit sind ebenfalls notwendige Parameter.
Tools, um das Beste aus Big Data herauszuholen
Big Data ist das, was die fortschrittlichen Analyseaktivitäten unserer Zeit wie künstliche Intelligenz antreibt. Je effizienter ein Unternehmen seine gesammelten Daten nutzt, desto mehr Potenzial kann es daraus ziehen. Die Investition in Software, die große Datenmengen verwalten und analysieren kann, insbesondere in Echtzeit, ist ein wichtiger Schritt für das Big-Data-Management.
MapReduce, BigTable und Hadoop: Wenn große Datenmengen gespeichert werden sollen und bessere oder effizientere Arten der Durchführung von Geschäftsaktivitäten identifiziert werden sollen, werden Tools wie Hadoop und Cloud-basierte Analysen genutzt. Sie helfen bei der Optimierung von Prozessen, um Kostenvorteile zu erzielen.
Darüber hinaus hilft die hohe Geschwindigkeit von Tools wie Hadoop in Verbindung mit In-Memory-Analytik dabei, ungenutzte Ressourcen zu identifizieren, d. h. neuere Datenquellen für die Analyse. Die Geschwindigkeit der Datenerfassung und -analyse ist für Unternehmen von großem Vorteil, um schnelle Entscheidungen zu treffen.
Komplexe Herausforderungen erfordern clevere Lösungen. Plattformen müssen Unternehmen mit intuitiven, einfachen Benutzeroberflächen ausstatten, die sicherstellen, dass sie selbst von den wenigsten IT-versierten Personen verwendet werden können. Die Plattform sollte auch in der Lage sein, das gesamte Spektrum von Big Data zu nutzen, was zu genauer Echtzeitanalytik führt. Die Fähigkeit, mehrere Terabyte an Datenclustern aus verschiedenen Quellen zu verarbeiten und diese erfolgreich in Dashboards umzuwandeln, die nützliche Erkenntnisse und Workflow-Analysen liefern, macht ein System erfolgreich.

Big-Data-Analytik: Erkenntnisse
- Big-Data-Analytik ermöglicht ein tieferes Verständnis der aktuellen Marktbedingungen, des Kaufverhaltens der Kunden, der Beliebtheit der Produkte usw., um die Fertigungs- oder Beschaffungsplanung zu optimieren.
- In ähnlicher Weise hilft Big Data einem Unternehmen dabei, herauszufinden, was seine Kunden mögen, zu welcher demografische Gruppe seine zahlenden Kunden gehören, und dann Wege zu finden, um seine Loyalität zu belohnen und zu fördern, um seine Kunden langfristig zu binden.
- Die Zufriedenheit der Kunden ist entscheidend für die Langlebigkeit des Unternehmens. Die Erkenntnisse von Big Data tragen wesentlich zur Verwaltung der Erwartungen und zur Gestaltung einprägsamer und effektiver Marketingkampagnen für verschiedene Kundenpersonas bei.
- Big-Data-Analytik kann auch ein Stimmungsmesser sein, der misst, wie Verbraucher über Ihre Marke, Ihren Service oder Ihr Produkt denken. Dies kann eine große Hilfe bei der Verwaltung des Markenimages sein. Big-Data-Erkenntnisse können dazu beitragen, die Online-Sichtbarkeit und Popularität zu verbessern und die hohen Bewertungen aufrechtzuerhalten.
- Erkenntnisse aus Big-Data-Analytik helfen Unternehmen dabei, ihre Produkte ständig zu innovieren und neu zu entwickeln, um der Konkurrenz einen Schritt voraus zu sein. Sie helfen dabei, die Hauptursache von Ausfällen, Problemen und Defekten zu identifizieren.
- Big Data hilft dabei, Muster zu erkennen, Risikoportfolios zu berechnen und betrügerisches Verhalten abzufangen, bevor ernsthafte Schäden entstehen.
Langfristige Vorteile aus der Verarbeitung von Big Data
Sobald Unternehmen Zeit und Ressourcen in die Infrastruktur investiert haben, die für die Verarbeitung von Big Data erforderlich sind, können folgende Vorteile nutzen:
- Optimierung der Ressourcen und Bestandsplanung
- Bessere Verwaltung der Anlagen
- Intuitiveres Verständnis der Kundenprofile
- Verbesserte Kunden-, Anbieter- und Lieferantenbeziehungen
- Kürzere Zeiten von der Bestellung zur Lieferung
- Bessere Integration über die gesamte Lieferkette
- Effektivere strategische Planung
- Kürzere Reaktionszeit bei Problemen mit der Lieferkette
- Verbesserter Kundenservice und schnellere Abwicklung
Auswirkung von Big Data auf verschiedene Sektoren: Beispiele
Big Data im Bildungssektor
Big Data hat zu großen Veränderungen im Bildungssektor geführt, insbesondere in folgenden Bereichen:
- Erstellung maßgeschneiderter, dynamischer und interaktiver Lern- und Entwicklungsprogramme
- Neudefinition des Umfangs der Kursunterlagen
- Modifizierung von Benotungssystemen für mehr Genauigkeit
- Karriereprognose und Beratung
Big Data im Versicherungssektor
Der Versicherungssektor ist nicht nur für Personen relevant, die eine Lebensversicherung anstreben, sondern auch für Unternehmen verschiedener Arten und Größen. Der gemeinsame Faktor ist, dass sowohl Menschen als auch Organisationen anfällig für Zeiten von Widrigkeiten, Katastrophen und anderen Unsicherheiten sind. Infolgedessen können Daten im Versicherungssektor in einer Vielzahl von Formaten aus unterschiedlichen Quellen stammen und sich ändern.
Wenn ein Kunde beispielsweise daran interessiert ist, eine Kfz-Versicherung abzuschließen, wenn er in ein bestimmtes Land reist, kann die Versicherungsgesellschaft die Daten für die Fahrbedingungen und die Verkehrssicherheit in diesem Land sammeln und verarbeiten und die Prämie entsprechend anpassen. Sie können auch die Fahrsicherheitsbilanz der Person sammeln und diese berücksichtigen, bevor sie ihr eine Kaufrichtlinie vorlegen.
Neben einer solchen Risikobewertung können Versicherungsunternehmen auch Big Data für die Bedrohungszuordnung verwenden. Dies bedeutet, dass sie die verschiedenen Möglichkeiten berücksichtigen können, bei denen bei einem bestimmten Kunden oder Unternehmen etwas schief gehen kann, was dazu führen kann, dass sie einen Anspruch geltend machen.
Big Data in der Regierung
Big Data hat sich für Regierungen auf der ganzen Welt als besonders wirkungsvoll erwiesen. Sie sind maßgeblich daran beteiligt, komplexe Probleme anzugehen, Governance sicherzustellen und wichtige Ereignisse nicht nur auf lokaler, sondern auch auf nationaler und globaler Ebene zu beeinflussen.
Big Data hat eine riesige neue Möglichkeit eröffnet, angesammelte Daten zu sammeln und zu erheben und nützliche Erkenntnisse daraus zu gewinnen, um sie mit Lebensfähigkeit und Kontext für verschiedene Organisationsprozesse zu versehen.