Welche Herausforderungen bringt Big Data mit sich?

Welche Herausforderungen bringt Big Data mit sich?
January 7, 2019 Shirin

Das Internet ist ein globales, komplexes Netzwerk, das Gegenstände und Menschen miteinander verbindet. Dieses dezentrale Netz, das in seiner Größe kaum quantifizierbar ist, wächst und verändert sich rasant. Big Data ist dabei eine Art Dokumentation der Transaktionen und Aktivitäten, die in diesem Netzwerk stattfinden. Aber was bedeutet Big Data für uns – und welche Herausforderungen ergeben sich daraus?

Das heutige Datenvolumen – besser bekannt als Big Data – ist nicht nur extrem groß und schnell wachsend, sondern aufgrund verschiedenartiger Datenquellen sehr vielfältig: von der Bereitstellung diverser Inhalte, Vernetzung von Menschen und Dingen bis hin zu räumlichen Spezifikationen. Diese Datenquellen lassen sich alle auf das Internet oder genauer gesagt, das Internet of Events, zurückführen. Die Bezeichnung kommt daher, dass jede Aktivität innerhalb des Internets automatisiert als sogenanntes Event protokolliert wird.

herausforderungen big data

Die 4 V’s von Big Data

Eine weitere Eigenart der Event-Daten ist, dass eine gewisse Unsicherheit in ihrem Wahrheitsgehalt existiert. Es kann beispielsweise nicht immer anhand der Daten bestimmt werden, ob der Eigentümer eines Smartphones auch tatsächlich der Benutzer ist. Oder ob das Profil einer realen Person in einem sozialen Netzwerk auch von dieser Person geführt wird.

Somit ergeben sich vier kennzeichnende Eigenschaften – die 4 V’s – von Big Data:

  1. “Volume” – ein großes Datenvolumen
  2. “Velocity” – eine hohe Geschwindigkeit in der Veränderungen und dem Wachstum der  Daten
  3. “Variety” –  viele verschiedene Datenquellen
  4. “Veracity” – die Unsicherheit der Richtigkeit bzw. des Wahrheitsgehalts der Daten

Die Big Data Challenge

Es existieren weltweit also riesige Datenmengen auf Festplatten, Rechnern oder Maschinen verteilt. Diese Daten sind nichts anderes als detaillierte und akkurate Informationen, beispielsweise zu wirtschaftlichen, sozialen oder politischen Aktivitäten. Allerdings bleiben diese Daten oftmals komplett unberührt.

herausforderungen big data

Professor Wil van der Aalst, der auch als “Erfinder” von Process Mining gilt, beschreibt das Problem im Zeitalter von Big Data wie folgt: “The challenge today is not to generate more data, but the challenge today is to turn this data into real value”. Daten haben wir wie Sand am Meer – aber was machen wir mit all diesen Daten? Wie transformieren wir die Daten in verwertbare Informationen?

Von der Erfassung der Daten bis hin zu ihrer Verwertung ist es ein weiter Weg. Dieser Weg ist auch nicht immer geradlinig: Regulatorische und gesetzliche Vorschriften beschränken den Datenzugriff und die Handlungsspielräume. Zusätzlich gilt es, verschiedene Datenquellen und -dokumentationen in eine einheitliche oder zumindest verständliche Form zu bringen. Denn was bringen uns Daten, die wir nicht verstehen?

herausforderungen big data

Data Science – die Lösung?

Schaut man sich den Prozess näher an, kommen immer mehr Fragen auf. Wie erhält man überhaupt Zugriff zu den tatsächlich relevanten Daten? Wie kann die Korrektheit der Daten verifiziert werden? Wie können die Daten in eine Sprache transformiert werden, die für uns – oder zumindest für die Experten unter uns – verständlich und kommunizierbar ist? Wie können diese Daten analysiert, interpretiert und verwertet werden? Und nicht zu vergessen: Wer ist dazu in der Lage? Da diese Problematik so komplex ist, ist daraus eine komplett neue Wissenschaft entstanden: die Datenwissenschaft bzw. Data Science.

Wie Data Science diese Fragen beantwortet und welche Herausforderungen es dabei zu bewältigen gilt, schauen wir uns im nächsten Artikel an.

LANA Process Mining realisiert das volle Potential Ihrer Prozessdaten. Schauen Sie sich live an, wie Prozessdaten automatisert visualisiert und analysiert werden. Vereinbaren Sie hier einen Demo-Termin!