Mit Process Mining zu besserer Datenqualität

Mit Process Mining zu besserer Datenqualität
May 13, 2019 Franzi

Wie kann durch Process Mining die Datenqualität gesteigert werden? Die Daten sind doch die Basis einer Prozessanalyse, und nicht das Ergebnis – oder? Zu Beginn eines Process-Mining-Projekts wählt ein Unternehmen einen spezifischen Prozess für die Analyse aus. Anschließend wird dieser Prozess mit Daten aus oftmals verschiedenen IT-Systemen angereichert, damit eine Process-Mining-Analyse möglich und sinnvoll ist. Dazu werden die Daten identifiziert, extrahiert und transformiert. Doch welche Auswirkungen hat diese Transformationen auf die Daten selbst? Ist es lediglich zur Befähigung von Process-Mining-Analysen wichtig, oder hat die Aufarbeitung der Daten noch weitere Vorteile? Die Antwort – Ja, mehr als Sie erwarten.

Datenqualität Daten verbessern improve data quality with lana process mining

Erkennen Sie die Relevanz von Daten

Nachdem Sie den konkreten Prozess zur Analyse ausgewählt haben, beginnt die Identifikation der notwendigen Informationen und Daten. Wichtig dabei ist, dass diese einen Zusammenhang zum jeweiligen Prozess besitzen und Antworten auf Ihre Analysefrage liefern. Daten, die dem Analysezweck nicht zuträglich sind, sollten Sie außer acht lassen, um die Komplexität der Datenextraktion und -transformation nicht unnötig zu steigern. Beispiel einer Bearbeitungszeit-Analyse bei einer Kundenbeschwerde: Hier sind die Kundendaten, -bestellungen, der Bestellstatus und die Dauer der Beschwerdebearbeitung von Bedeutung. Irrelevant ist hingegen zunächst der Wohnort des Kunden.

Es ist also wichtig zu verstehen, welche Daten für welche Prozesse und somit für deren Analyse von Interesse sind. Daraus wird deutlich, dass Daten keine Abfallprodukte bei der Nutzung von IT-Systemen, sondern sehr entscheidende Ressourcen mit dem Potential zu immensem Informationsgewinn sind.

Strategisch transformieren. Smart implementieren. Nachhaltig optimieren.

Mit LANA Process Mining haben Sie die volle Kontrolle über Ihre Digitalisierungsstrategie. Wie LANA Ihr Unternehmen schneller, effizienter und smarter macht, erfahren Sie im Gespräch mit unseren Experten.

Entdecken und nutzen Sie Zusammenhänge

Sie wissen nun also, welche Daten zu dem ausgewählten Prozess gehören bzw. für diesen relevant sind. Vor allem wenn Daten in unterschiedlichen IT-Systemen gehalten werden, ist dies oftmals nicht transparent. Dadurch, dass jedoch all diese Daten zu ein und demselben Prozess gehören, lassen sich Zusammenhänge zwischen den Daten besser erkennen oder gar neue Verbindungen ableiten. Aus diesen Relationen wird oftmals erst die tatsächliche Bedeutung der Daten klar. Diese Erkenntnisse helfen Ihnen bei der Interpretation der Daten, den Analysen und der Deutung der Ergebnisse.

Auch das Fehlen von prozessrelevanten Daten können Sie so erkennen. Ursachen für fehlende Daten sind häufig nicht oder nur schlecht abgebildete digitale Prozesse. Seltener hingegen ist eine fehlerhafte Konfiguration des Systems, wodurch Daten nicht oder in anderer Form gespeichert werden. Nutzen Sie diese Erkenntnisse zur Optimierung Ihrer Systemprozesse.

Überwinden Sie Systembrüche

Während der Auswahl der relevanten Daten wird darüber hinaus auch deutlich, welche IT-Systeme am ausgewählten Prozess beteiligt sind und wo sich demzufolge die benötigten Daten befinden. Es ist wichtig zu wissen, wo diese Daten verortet sind, um sie anschließend zu extrahieren. Daten sind dabei je nach Datenquelle in Form von Datenbanken, als Dateien oder sogar handschriftlich vorhanden. Beispielsweise liegen Kundendaten im CRM-System wohingegen die Daten zur Auslieferung einer Bestellung im ERP-System vorliegen. Durch LANA Process Mining wird es möglich, Daten verschiedenster Quellen in einer Analyse zu nutzen und so einfach Systembrüche zu überwinden. LANA fungiert damit als Brücke in Ihrer Systemlandschaft.

Erkennen Sie die Datenstruktur

Nachdem Sie alle relevanten Daten und Systeme identifiziert haben, geht es an die Extraktion der Daten. Während oder unmittelbar nach der Datenextraktion wird ersichtlich, welche Struktur die Daten besitzen. Sie sehen, ob es sich um Daten mit einer festen Struktur aus einer Datenbank handelt, um semistrukturierte Daten wie etwa E-Mails oder doch eher um unstrukturierten Daten ohne festgelegten Aufbau, bei denen lediglich der Datentyp bekannt ist (bspw. Bilder, Audio- oder Videodateien).

Auch innerhalb der Daten stellt sich erneut die Frage: Welche Informationen sind relevant? Diesmal richtet sich die Frage jedoch an die Struktur. Darunter fällt beispielsweise der Ausschluss bestimmter Spalten bei strukturierten Daten oder aber bestimmter Parameter bei semi- oder unstrukturierten Daten, weil diese Informationen für die geplante Analyse irrelevant sind. In unserem Beispiel ist so eine Spalte der Wohnort des Kunden, der sich beschwert. Das Wissen, wie diese abstrakten Datensätze tatsächlich strukturiert sind, bringt Ihnen somit nicht nur wichtige Informationen zur Process-Mining-Analyse, sondern auch ein tiefer gehendes Verständnis über Ihre virtuellen IT-Strukturen.

Mit bereinigten und einheitlichen Daten in die Analyse

Damit Sie die extrahierten Daten für die Analyse nutzen können, müssen sie im vorhinein aufbereitet werden. Diese Aufbereitung meint zumeist eine Bereinigung der Daten, beispielsweise von doppelten Datensätzen, sowie eine Vereinheitlichung des Datenformats, um Daten aus unterschiedlichen Quellen gemeinsam nutzen zu können. Durch die Eliminierung von Dopplungen und Falschwerten steigt die Datenqualität spürbar an.

Je nachdem, welche Entscheidungen Sie im vorherigen Schritt getroffen haben, werden zum Teil nicht nur einzelne Werte, sondern ganze Spalten, wie der Wohnort, aus den Daten entfernt. Weiterhin sollten Sie klären, wie Sie mit Leerwerten in den Daten umgehen. Grundsätzlich ist es ratsam, Leerwerte in Nullwerte umzuwandeln, da viele Tools so besser mit den Daten arbeiten können. Plausible bzw. begründete Nullwerte sollten Sie beibehalten, um die Analysen nicht zu verfälschen.

Abschließend werden die Daten in ein einheitliches Format transformiert. Liegen die Daten bereits in einem einheitliche Format vor und entspricht dieses dem angestrebten Zielformat, welches das Analyse-Tool verarbeiten kann, ist dieser Schritt nicht notwendig. Durch die Vereinheitlichung und Bereinigung steigt die Datenqualität deutlich an. Für Process-Mining-Analysen mit LANA sollten die Daten folgende Struktur aufweisen:

Datenqualität Datenstruktur Data structure process mining activity aktivität start ende

Bessere Datenqualität führt zu besseren Erkenntnissen

Sie sehen also, dass durch Process-Mining-Projekte die Datenqualität in jedem Fall steigt. Die Daten werden von Redundanzen oder Fehlern bereinigt und in ein einheitliches Format gebracht. Darüber hinaus steigt das Verständnis bezüglich der Daten und ihrer Zusammenhänge. Dadurch verbessern Sie nicht nur die Qualität der Daten selbst, sonder auch Ihren Umgang mit den Daten und daraus folgend auch mit den Analysen. Durch bessere Daten treffen Sie bessere, fundiertere Entscheidungen, die Ihren Unternehmenserfolg nachhaltig steigern.

Machen Sie den ersten Schritt zu besserer Datenqualität! Sprechen Sie mit unseren Experten darüber, wie Sie mit LANA Process Mining durchstarten können.