Was ist ein Data Scientist?

Ein Data Scientist ist ein Beruf, der eine Reihe von technischen und domänenbasierten Fähigkeiten erfordert, um Daten zur Lösung von Geschäftsproblemen zu verwalten und zu analysieren. Er/sie ist zum Teil Mathematiker, teils Business Analyst und zum Teil Informatiker. Ein guter Data Scientist kann Trends und Muster in Daten erkennen und weiß, wie man Daten verwendet, um hilfreiche, umsetzbare Ergebnisse zu erzielen. Data Scientists stehen bei modernen Unternehmen an vorderster Front und verändern unsere Arbeitsweise.

Diagramm der Fähigkeiten von Data Scientists

Geschichte der Data Scientists

Im Jahr 2001 schrieb ein Informatiker, William S. Cleveland, einen Artikel „Data Science: Ein Aktionsplan zur Erweiterung des technischen Bereichs Statistik“. In diesem Artikel wurde Data Science als Disziplin der angewandten Statistiker vorgestellt. Das war vor 20 Jahren, und die Technologie- und Geschäftswelt hat sich seitdem schnell entwickelt.

Da dies ein relativ neuer Karriereweg ist, kommen aktuelle Data Scientists aus einer Reihe von Hintergründen und Fachgebieten. Viele beginnen ihre Karriere als Statistiker, Mathematiker oder Datenanalysten. Aber da der Zugang zu Computern, künstlicher Intelligenz (KI) und Lernwerkzeugen für Daten üblich geworden ist, hat sich die Rolle weiterentwickelt. Ein Data Scientist ist nicht mehr auf die IT-Abteilung beschränkt, er/sie ist zu einem integralen Bestandteil des Gesamtgeschäfts geworden. Aufgrund seiner Expansion und seines entscheidenden Einflusses auf das Unternehmen erfordert die Rolle des Data Scientist eine Person mit logischem, innovativem Denken, um Datenerkenntnisse in die Geschäftsstrategie umsetzen zu können.

Welche Qualifikationen benötigt ein Data Scientist?

In den letzten zehn Jahren haben Hochschulen spezifische Kurse für Datenwissenschaftler entwickelt. Diejenigen, die in der Branche arbeiten möchten, können einen Bachelor oder Master in Data Science von einer großen Anzahl von Universitäten erhalten.

Die Kurse, an denen Data Scientists teilnehmen, umfassen in der Regel statistische Modellierung, Datenverwaltung, Daten-Visualisierung, maschinelles Lernen, Softwareentwicklung, Datenethik, Forschungsdesign und Benutzererfahrung. Sie lernen möglicherweise SQL, Python, Perl und eine Reihe anderer Programmiersprachen wie R. Sie werden sich mit Hadoop, Pig, Spark, Hive und MapReduce vertraut machen.

Angesichts der Verfügbarkeit von Open-Source-Software und mehr kommerzialisierten Data-Science-Tools könnte das, was die Menschen heute lernen, jedoch bald überholt sein. Daher müssen Data Scientists agil sein und weiterhin neue Fähigkeiten und Techniken in der Branche erlernen.

Welcher DataScience-Superheld sind Sie?
Welcher DataScience-Superheld sind Sie?
Laden Sie dieses E-Book herunter, um die sechs wichtigsten Fähigkeiten zu erlernen, die Sie als Data Scientist herausragen lässt.

Data Scientists brauchen mehr als nur einen Abschluss

Ein ausgezeichneter Data Scientist sollte neugierig sein und immer nach neuen Informationen und neuen Denkweisen über geschäftliche Herausforderungen suchen. Ein starkes Gefühl der Intuition und die Angewohnheit, Beweise zu benötigen, sind ebenfalls hervorragende Eigenschaften für einen Data Scientist. Sie müssen kreativ genug sein, um dort Antworten zu finden, wo es keine gab, und ständig nach Erkenntnissen und Ergebnissen suchen.

Datenwissenschaftler benötigen auch ein tiefes Gefühl für Domäne-Fachwissen. Daten zu kennen und zu programmieren ist eine Sache, die Einsicht zu haben, aus diesen Erkenntnissen eine andere Geschäftsstrategie zu erstellen. Sie sollten in der Lage sein, Risiken und Chancen für das Unternehmen zu erkennen und Daten zu nutzen, um Strategien für das Unternehmenswachstum bereitzustellen. Es ist eine Sache, zu wissen, dass Menschen bei einem bestimmten Wetter mehr kaufen, aber wie kann ein Unternehmen diese Art von Informationen nutzen? Die Rolle des Data Scientist besteht darin, Fragen wie diese herauszufinden und zu beantworten, die das Unternehmen kontinuierlich zu neuen Höhen bringen.

Ein großartiger Data Scientist benötigt auch ausgezeichnete Kommunikationsfähigkeiten. In der Lage zu sein, bei Stakeholdern und Managern Bericht zu erstatten und die Ergebnisse der Analysen klar zu erläutern. Erklären zu können, wo die Daten unvollständig waren und was benötigt wird, um sie zu lösen. Auf der Grundlage dieser Ergebnisse die beste Vorgehensweise zu überzeugen und zu überreden. Neue Programme und Techniken werden sich ändern, aber es wird immer gefragt sein, kritisch denken zu können und gute quantitative, domänenspezifische Fähigkeiten zu besitzen.

Was macht ein Data Scientist?

Ein Data-Scientist nimmt Daten, entwickelt Hypothesen und Schlussfolgerungen und nutzt dann maschinelles Lernen, um Muster, Beziehungen und Trends innerhalb dieser Daten zu erkennen. An einem beliebigen Tag können sie:

  • Datensätze analysieren
  • Daten bereinigen
  • Dashboards und Berichte erstellen
  • Daten visualisieren
  • Statistische Schlussfolgerungen machen
  • Statistische Lernmodelle entwickeln
  • Komplexe prädiktive Modelle erstellen
  • Statistik-Tools verwenden
  • Die Analyseergebnisse an Stakeholder übermitteln
  • Die Entscheidungsträger überzeugen

Große Einzelhandelsunternehmen können täglich bis zu 40 Petabyte an Daten produzieren. Ihre Data Scientists verwenden diese Daten, um eine Reihe von Ergebnissen vorherzusagen, einschließlich wann und wo Menschen bestimmte Artikel kaufen. Dadurch können Sie Ereignisse und Verkäufe für maximalen Umsatz planen und Dinge so preisen, dass sie immer noch maximalen Gewinn erzielen, aber auch die größte Menge an Aktien bewegen.

Data Scientists arbeiten in der Regel in Teams, um Big Data für relevante Informationen abzubauen. Sie können auch das Management darüber beraten, welche Art von Daten gesammelt werden sollen, wie sie analysiert werden sollten und welche Ergebnisse diese Interpretation haben. Eine Studie aus dem Jahr 2017 zeigte, dass 80 Prozent der Zeit eines Data Scientist für die Datenverwaltung aufgewendet werden. Sie zu finden, zu bereinigen und zu organisieren. Dies lässt nur 20 Prozent ihrer Arbeitszeit für die tatsächliche Durchführung von Analysen zu. Aber selbst dies ändert sich. Mit dem Aufkommen von automatisiertem maschinellen Lernen und Deep Learning stellen Data Scientists fest, dass sie mehr Zeit für die Analyse haben, da diese Tools automatisierter geworden sind und einen Großteil der Datenbereinigung und -organisation übernommen haben, sodass Data Scientists mehr Zeit für Analysen haben.

Warum ist die Rolle von Data Scientists so wichtig?

Für ein Unternehmen ist ein Data Scientist von unschätzbarem Wert. Sie nehmen Millionen, sogar Milliarden von Datenpunkten und wandeln diese in wichtige Informationen um, um Vorhersagen über ein Unternehmen zu treffen, das ein Unternehmen entweder retten oder ausbauen könnte. Einige Beispiele für Data Scientists aus der Industrie sind:

Marketing-Optimierung

Data Scientists sind ein wesentlicher Bestandteil des Marketings. Zum Beispiel kann ein Data Scientist eine Reihe von Auslösern erstellen, die das Unternehmen darauf aufmerksam machen, dass seine Kunden einem hohen Risiko der Abwanderung ausgesetzt sind. Im Marketing ist bekannt, dass die Kosten für die Suche nach einem neuen Kunden die Kosten für die Beibehaltung eines bestehenden Kunden enorm überwiegen. Die Auslöser, die vom Data Scientist eingerichtet wurden, ermöglichen es einem Unternehmen, einzugreifen und Änderungen vorzunehmen oder mit dem Kunden zu sprechen, um sie zu behalten.

Gesundheitswesen

Dies ist ein riesiger Bereich mit enormen Möglichkeiten für Data Scientists. Von der Verwaltung von Dienstplänen und Personalbesetzungen auf optimalem Niveau bis hin zur Identifizierung, bei denen Patienten ein hohes Risiko haben, die Anweisungen ihres Arztes nicht zu erfüllen, kann ein Data Scientist Tausende von Möglichkeiten zur Verbesserung der Geschäftspraktiken und Gesundheitsergebnisse finden.

Betrugsbekämpfung

Die Versicherungs- und Bankenbranchen sparen jedes Jahr Milliarden von Dollar, indem sie Data Scientists zur Identifizierung von Betrugsrisiken einsetzen. Wenn ein/e Kunde/Kundin beispielsweise einen Kredit beantragt, werden eine Reihe von Datenpunkten über ihn gesammelt. Diese Informationen werden verarbeitet und mit bekannten Informationen über frühere Betrugsfälle verglichen. Das System kann fast sofort beraten, ob diese Person ein Risiko darstellt.

Ausbildung zum Data Scientist

Wenn Sie ein logisches Gehirn haben, mit Zahlen umgehen können, Spaß an der Arbeit mit Computern haben und ein ausgeprägtes Geschäftsverständnis haben, kann eine Rolle als Data Scientist Ihr Traumjob sein.

Der erste Schritt ist ein Bachelor-Abschluss in Informatik, Statistik oder einem ähnlichen Fachgebiet. Dieser Abschluss wird Sie mit Fähigkeiten in folgenden Bereichen ausstatten:

  • Mathe, insbesondere Statistiken
  • Codierung
  • Datenbanken, Data Lakes und verteilte Speicherung
  • Techniken zur Datenbereinigung
  • Daten-Visualisierungs- und Reporting-Fähigkeiten

Ein Bachelor-Abschluss vermittelt Ihnen wissen für Berufseinsteiger, aber beim Aufstieg im Berufsfeld mehr Qualifikationen oder Spezialisierungen erforderlich sind. Ziehen Sie einen Master-Abschluss in Daten oder ähnlichen Bereichen in Betracht und beginnen Sie, in eine bestimmte Geschäftsdomäne einsteigen, die Sie interessiert.

Sobald die Qualifikationen erworben wurden, besteht der nächste Schritt darin, Erfahrungen im Interessenbereich zu sammeln. Gesundheitswesen, Marketing, Regierung oder Unternehmen bieten hervorragende Aussichten auf Spezialisierung. Während die Fähigkeiten von Data Scientists vermittelt werden können, erfordert das Verständnis der Beziehungen zwischen den Daten und den Auswirkungen auf das wirkliche Leben Erfahrung und Zeit, die im Geschäft verbracht werden.

Data Science-Software
Testen Sie TIBCO Data Science - Kostenlose Testversion
Demokratisieren, kooperieren und operationalisieren Sie maschinelles Lernen in Ihrem Unternehmen mit TIBCO Data Science.

Herausforderungen für Datenwissenschaftler

Das ist zum Teil darauf zurückzuführen, dass es sich um eine neue Branche handelt, und deswegen stehen Data Scientists vor einigen Herausforderungen. Es ist eine von Männern dominierte Branche, und wie viele MINT-Karrieren (Wissenschaft, Technologie, Ingenieurwesen und Mathematik) stehen Frauen manchmal vor zusätzlichen Hürden, um ihre Karriere zu beginnen und aufrechtzuerhalten. Im Jahr 2019 waren nur 18 Prozent der Data Scientists Frauen. Dieser Mangel an Vielfalt beginnt, Probleme auf diesem Gebiet zu schaffen. Algorithmen werden von Menschen erstellt und sind gegenüber Voreingenommenheiten anfällig. Zum Beispiel wird es in der Bankenbranche ein Nachteil sein, eine einzige Frau zu sein, wenn sie einen Kredit bekommen. Die Daten zeigen jedoch, dass Frauen bei der Kreditabzahlung besser abschneiden als Männer. Banken verpassen möglicherweise ihre besten Kunden und Frauen verpassen finanzielle Sicherheit und Unabhängigkeit. Eine vielfältige Belegschaft wird dazu beitragen, diese Fehler und Voreingenommenheit zu bekämpfen.

Da es sich um eine neue Branche handelt, hat sie auch mit einem einheitlichen Wortschatz und den Standards der Praxis zu kämpfen. Es wird erwartet, dass Standards eine Einigung zwischen Stakeholdern, Data Scientists selbst und Gesetzgebern haben müssen, aber es wurden noch keine erzielt.

Es gibt auch einen Drang für erklärbare KI, die einfach interpretiert werden kann. Vordenker sind der Meinung, dass Vorhersagen nicht nur eine aus der Luft gegriffene Zahl sein sollten, sondern dass Sie in der Lage sein sollten, die Logik hinter den Modellen des maschinellen Lernens zu verfolgen und leicht zu erklären.

Aktueller Ausblick für Data Scientists

Wie die meisten MINT-Karrieren sind Data Scientists sehr gefragte und geschätzte Mitarbeiter. Derzeit gibt es einen Mangel an qualifizierten Data Scientists mit entsprechenden analytischen Fähigkeiten. Mit überdurchschnittlichen Gehaltserwartungen, einem schnell wachsenden Markt und einem erhöhten Verständnis ihres Wertes sind die Beschäftigungsmöglichkeiten für Data Scientists hervorragend. Im Jahr 2018 gab es einen Mangel an 151.000 Data Scientists, was es zu einem sicheren und wachsenden Berufsfeld machte.

Insbesondere Menschen aus unterrepräsentierten Gruppen werden ermutigt, in das Berufsfeld einzusteigen. Da einige Universitäten Anreize für diese unterrepräsentierten Gruppen bieten, an Data-Science-Programmen teilzunehmen, und Unternehmen, die zunehmend erkennen, dass Vielfalt für unvoreingenommene Ergebnisse erforderlich ist, stellt dies eine attraktive und stabile Beschäftigungsoption dar.