Intrenion

Grundlagen und Vergleich ausgewählter Software für Process-Mining

Christian Ullrich
2014-10-31

Zusammenfassung

Die vorliegende Arbeit ist ein Bestandteil des Projektseminars im Masterstudiengang Wirtschaftsinformatik an der Universität Würzburg im Wintersemester 2014/2015. Ziel ist die Darstellung der Grundlagen des Process-Mining. Weiterhin werden Softwareanwendungen zur Durchführung des Process-Mining miteinander verglichen. Process-Mining ist eine Form des Prozessmanagements, die Techniken des Data-Mining nutzt. Dabei werden Geschäftsprozesse mit Hilfe eines Algorithmus automatisiert erkannt und grafisch dargestellt. Dies wird beispielsweise in Unternehmen zur Prozesserkennung und -optimierung genutzt. Die Arbeit beschreibt theoretische Grundlagen und praktische Ansätze zur Vorgehensweise. Als Grundlage der Softwareanalyse dient eine Webrecherche. Anhand der Anforderungen des Projektseminars werden verschiedene Lösungen miteinander verglichen.

Abstract

This work was part of the project seminar in the Master of Science in Business Information Systems program at the University of Würzburg during the winter semester of 2014/2015. The objective was to show the fundamentals of process mining. Furthermore, software applications are compared to perform process mining. Process mining is a form of process management that uses data mining techniques to automate business processes identified by algorithms and display them graphically. This is used in companies for process discovery and optimization. This paper describes the theoretical foundations and practical approaches of the procedure. The basis for comparing the software is web research. Based on the project seminar requirements, several solutions are compared.

Inhaltsverzeichnis

1 Einführung

In Zeiten zunehmenden globalen Wettbewerbs steigen die Anforderungen an Unternehmen, sich in ihrem Marktumfeld zu behaupten. Neben der Entwicklung neuer Produkte gilt es, die Organisation schlank zu halten und Leistungen zu wettbewerbsfähigen Kosten zu erbringen. Bei deutschen Unternehmen sind seit einiger Zeit wieder verstärkt entsprechende Maßnahmen zu beobachten, um schneller auf sich wandelnde Märkte reagieren zu können.

Kleine und mittlere Unternehmen erledigen Geschäftsprozesse häufig ad hoc. Größere Unternehmen sind häufig deutlich komplexer, sodass die Definition einheitlicher Geschäftsprozesse erforderlich ist. Andernfalls können Mitarbeiter schnell überfordert sein, sodass Aufträge nicht ordnungsgemäß bearbeitet werden. Seit Jahren werden mittels verschiedener Maßnahmen des Geschäftsprozessmanagements interne Vorgehensweisen sowie der organisatorische Aufbau dokumentiert und verbessert. Spätestens bei der Einführung einer neuen Software, zum Beispiel für die Finanzbuchhaltung oder die Personalverwaltung, müssen betriebliche Prozesse einheitlich definiert und in der Software implementiert werden, beziehungsweise Standardprozesse der Software im Unternehmen eingeführt werden.

Die Dokumentation und Anpassung von Geschäftsprozessen erfolgen in den meisten Fällen noch immer händisch: In komplexen Befragungs- und Dokumentationsprozessen werden Prozesse ermittelt, dokumentiert und verändert. Der Aufwand ist vergleichsweise hoch, und der Support für Software-Werkzeuge ist nur in geringem Maße automatisiert.

Process-Mining beschreibt die Ermittlung von Prozessen durch die Auswertung von Daten. Es verbindet das Prozessmanagement mit dem Data-Mining. Ziel ist eine automatisierte Dokumentation von Geschäftsprozessen anhand elektronischer Protokolle (englisch: Logs). Wenn die Dokumentation bestehender Prozesse statt per Interview in Wochen mit Hilfe einer Software in Tagen durchgeführt wird, kann das viele Ressourcen und damit Geld einsparen.

Diese Arbeit dient als Vorbereitung auf das Projektseminar im Masterstudium Wirtschaftsinformatik an der Universität Würzburg am Lehrstuhl von Prof. Dr. Thiesse im Wintersemester 2014/2015. Sie soll dabei zwei wesentliche Ziele erfüllen:

  1. Erläuterung der Grundlagen des Process-Mining
  2. Vergleich und Auswahl von Software zur Durchführung des Process-Mining im Rahmen des Projektseminars

Damit werden zum einen eine theoretische Grundlage und zum anderen ein praktischer Beitrag geleistet. Es gilt, sich dem Thema Process-Mining möglichst umfassend und zugleich anschaulich zu nähern, statt eine spezifische Fragestellung zu untersuchen. Der Anteil theoretischer Modelle wird zugunsten praxisrelevanter Informationen zur konkreten Vorgehensweise reduziert.

2 Grundlagen

2.1 Prozessmanagement

Prozessmanagement bezeichnet die Aufgabe eines Unternehmens, im Rahmen des strategischen Managements Prozesse systematisch und regelmäßig an die Bedürfnisse des Wettbewerbsumfelds anzupassen. Dabei wird zwischen kontinuierlicher Weiterentwicklung und radikaler Veränderung unterschieden. Für beide Formen gibt es in der Managementforschung verschiedene Ansätze, beispielsweise Total-Quality-Management und Lean-Management für die kontinuierliche Verbesserung sowie Business-Process-Reengineering als Form der radikalen Veränderung. (Brocke 2013, 1)

Ein wesentlicher Bestandteil des Prozessmanagements ist die Dokumentation bestehender Prozesse. Dies dient der Standardisierung, um die Umsetzung im täglichen Betrieb geordnet zu gestalten. Zudem kann eine Verbesserung häufig nur mit Kenntnis der aktuellen Situation erfolgen. Durch eine grafische Visualisierung der Prozesse im Vergleich zur Beschreibung als Fließtext sind diese deutlich besser verständlich. Die Form und der Aufbau der Dokumentation sind in Prozessmodellen definiert. Diese sind aufgrund mehrerer Faktoren nützlich: (Aalst 2011, 6)

Es gibt zahlreiche Modelle zur Beschreibung von Prozessen. Nicht alle dienen primär der Modellierung von Geschäftsprozessen, sondern können auch der Softwareentwicklung (Unified Modeling Language) oder der Entwicklung von Unternehmensarchitekturen (ArchiMate) entstammen. In der Unternehmenspraxis wird zum Zwecke der Geschäftsprozessmodellierung überwiegend die Business Process Modeling Notation (BPMN) verwendet. (Aalst 2011, 42ff)

Bei der Nutzung von Prozessmodellen sollte sich der Anwender der jeweiligen Limitierungen bewusst sein. Zudem stellt kein Prozessmodell die Wirklichkeit dar. Vielmehr wird ein Idealzustand definiert, den es möglichst einzuhalten gilt. Im Rahmen des Process-Mining sollen zudem Abweichungen zwischen der Wirklichkeit und dem Modell identifiziert werden. (Aalst 2011, 59)

Abbildungen 1 und 2 zeigen einen exemplarischen Geschäftsprozess, modelliert als Petrinetz und gemäß dem BPMN-Schema.

Abbildung 1: Ein als Petrinetz modellierter Prozess (Aalst 2011, 4)

Abbildung 1: Ein als Petrinetz modellierter Prozess (Aalst 2011, 4)

Abbildung 2: Ein im BPMN-Schema modellierter Prozess (Aalst 2011, 5)

Abbildung 2: Ein im BPMN-Schema modellierter Prozess (Aalst 2011, 5)

2.2 Data-Mining

Process-Mining basiert auf Prozessmanagement und Data-Mining. Letzteres beschreibt die Auswertung von Daten mit dem Ziel, Muster zu erkennen. Diese Muster sollen einen großen Teil des Datenbestands gültig, nützlich und verständlich beschreiben. (Chamoni 2013, 1)

Data-Mining wird für verschiedene Aufgaben verwendet, die sich wie folgt gliedern: (Aalst 2011, 59-91; Chamoni 2013, 3f)

Der Cross Industry Standard Process for Data Mining (CRISP-DM) beschreibt die Vorgehensweise beim Data-Mining: (Marban 2009, 6)

  1. Business Understanding: Die erste Phase befasst sich mit dem Verständnis des Projekts. Dabei werden die Data-Mining-Fragestellung und eine Planung der Vorgehensweise erstellt.
  2. Data Understanding: Im Rahmen der zweiten Phase werden zunächst die benötigten Daten gesammelt. Diese können aus verschiedenen Quellen, zum Beispiel aus operativen Informationssystemen, stammen. Anschließend müssen die Daten, ihr Aufbau und ihr Potenzial verstanden werden. Die Datenqualität spielt eine wichtige Rolle, um die zuvor festgelegten Ziele zu erreichen. Interessante Untermengen der Daten können weitere Fragestellungen hervorrufen.
  3. Data-Preparation: In dieser Phase werden die Ausgangsdaten transformiert, sodass der eigentliche Analyseprozess durchgeführt werden kann. Dieser Schritt wird unter Umständen vor weiteren Data-Mining-Aktivitäten wiederholt.
  4. Modeling: Hierbei werden die verschiedenen Modellierungstechniken ausgewählt und vorbereitet, etwa durch die Anpassung von Parametern. Da für ein Problem häufig verschiedene Modellierungstechniken zur Verfügung stehen, kann dieser Schritt eine gewisse Zeit in Anspruch nehmen. Häufig ist die Wiederholung des Schritts Data-Preparation
  5. Evaluation: Bevor das Modell angewandt werden kann, wird es umfassend auf Fehler und Inkonsistenzen geprüft. Insbesondere sollte ein Abgleich des erstellten Modells mit den Zielen erfolgen. Weiterhin wird im Rahmen der Evaluation entschieden, wie mit den Ergebnissen des Data-Mining-Prozesses verfahren wird.
  6. Deployment: Im letzten Schritt wird das vorbereitete Projekt umgesetzt. Dies geschieht in der Regel mithilfe einer speziellen Software. Im Rahmen dessen werden die Ergebnisse zudem grafisch aufbereitet, was die anschließende Auswertung erleichtert.

Die Aufgaben werden mithilfe verschiedener Verfahren bearbeitet, die sich in verschiedene Kategorien einordnen lassen. Abbildung 3 zeigt die Zuordnung der Verfahren zu den Aufgaben des Data-Mining. (Chamoni 2013, 4f)

Abbildung 3: Data-Mining-Aufgaben und -Verfahren (Beekman et al. 2006, 267

Abbildung 3: Data-Mining-Aufgaben und -Verfahren (Beekman et al. 2006, 267

Im Rahmen des Projektseminars wird eine gesonderte Projektseminararbeit erstellt, die Software für Data Mining vergleicht. (Venus 2014)

2.3 Process-Mining

Als Ausgangssituation gilt die Realität (engl. world), die “gelebte” Geschäftsprozesse umfasst. Die Realität wird in Anwendungssystemen (engl. software system) mittels Ereignisprotokollen (engl. event logs) abgebildet. Gleichzeitig sollen Prozessmodelle der Wirklichkeit erstellt (engl. discovery) oder bestehende auf Konformität geprüft (engl. conformance) oder erweitert (engl. enhancement) werden. Dieses Abbilden der gespeicherten Realität in Prozessmodellen wird als Process-Mining bezeichnet. Die Prozessmodelle dienen durch ihre Beschreibung der Realität, zum Beispiel der Konfiguration von Anwendungssystemen. Abbildung 4 veranschaulicht diesen Zusammenhang. (Aalst 2011, 9f)

Ereignisse (engl. event), ausgelöst durch einen Anwender oder ein Anwendungssystem, werden in ein Ereignisprotokoll (engl. event log) protokolliert. Dabei kann jedes Ereignis einer Aktivität (activity) zugeordnet werden und ist Teil eines Falls (engl. case). So entsteht eine Reihe (engl. trace) von Ereignissen, die im Ereignisprotokoll festgehalten werden. Dies kann sehr unterschiedlich aussehen, ist jedoch in der Regel unstrukturiert. Viele Ereignisprotokolle speichern noch weitere Informationen, zum Beispiel Ressourcen (engl. person, device), die das Ereignis auslösen, Zeitstempel, wann das Ereignis ausgelöst wurde, sowie Datenelemente (Attributwerte). (Aalst 2011, 9)

Das Verhältnis von verwendetem Input zu erhaltenem Output kann sich unterschiedlich darstellen: (Aalst 2011, 18)

Abbildung 4: Einordnung des Process-Mining (Aalst 2011, 9)

Abbildung 4: Einordnung des Process-Mining (Aalst 2011, 9)

Es gibt drei verschiedene Nutzungsarten des Process-Mining. Diese beschreiben die Zielsetzung des Process-Mining und, wie in Abbildung 4 veranschaulicht, das Verhältnis zwischen Ereignisprotokoll und Prozessmodell (Aalst 2011, 10):

Die Ergebnisse des Process-Mining münden in einem Prozessmodell, das die vorliegenden Geschäftsprozesse beschreibt. Dabei wird zwischen Lasagne- und Spaghetti-Prozessen unterschieden:

2.4 Durchführung

Auch für das Process-Mining gibt es Empfehlungen zur Vorgehensweise. Abbildung 5 zeigt den Zusammenhang der verschiedenen Prozessschritte eines Data-Mining-Prozesses.

Die einzelnen Prozessschritte sind gegeneinander abgegrenzt: (Aalst 2011, 237-240 und 285f)

  1. Planung: Im ersten Schritt werden die Zielsetzungen, die Fragestellungen und die einzelnen Projektschritte festgelegt. Zudem sollte die Planung eine Ressourcenzuteilung, einen Zeitplan sowie gegebenenfalls Meilensteine enthalten. Insbesondere bei größeren Projekten ist ein kontinuierliches Projektmanagement und -controlling anzuraten. Darüber hinaus gibt es beim Process-Mining drei Projektarten, die sich in der Fragestellung unterscheiden.
    1. Datenorientiert: Dabei wird keine konkrete Fragestellung formuliert. Vielmehr werden die vorhandenen Daten ergebnisoffen analysiert.
    2. Konkrete Fragestellung: Hierbei werden im Vorhinein konkrete Fragestellungen formuliert, beispielsweise zu durchschnittlichen Durchlaufzeiten oder zu Kausalitäten bei Problemen. Diese Vorgehensweise empfiehlt sich für Organisationen, die sich neu mit dem Thema Process-Mining beschäftigen.
    3. Zielorientiert: Um konkrete Ziele wie eine Kostensenkung oder eine Prozessvereinfachung zu erreichen, werden in der Planung Leistungskennzahlen (KPIs) festgelegt. Nach der Analyse der Prozesse werden diese verbessert und die Leistungskennzahlen erneut gemessen.
  2. Extraktion: Mit der Extraktion werden die relevanten Datensätze ausgewählt und Ziele sowie Fragestellungen definiert. Die Daten stammen dabei in der Regel aus einzelnen Applikationen oder einem Data-Warehouse. Im Rahmen der Filterung werden die Teile ausgewählt, die für die konkrete Fragestellung relevant sind. Zudem erfolgt die Umwandlung in ein mit der Process-Mining-Software kompatibles Datenformat. Insbesondere müssen die Zeitstempel sowie die eindeutige Zuordnung von Ereignissen (event) zu Fällen (case) vorhanden sein. In die Extraktion fließen außerdem händisch erstellte Prozessmodelle (z.B. aus früheren Prozessmanagementprojekten) ein. Diese erhalten im Rahmen des Data-Mining-Prozesses ein automatisch erstelltes Äquivalent. Somit können sie im Nachhinein zum Vergleich dienen, wobei die Detailtiefe gegebenenfalls variieren kann. Insbesondere der Vergleich von Anspruch und Wirklichkeit bei der Durchführung des verglichenen Prozesses ist interessant.
  3. Erstellen der Kontrollflussdiagramme und Verknüpfung mit den Ereignisprotokollen: Im dritten Schritt werden die Kontrollflussdiagramme (engl. control-flow model) erstellt (discover). Dies erfolgt automatisiert durch die Algorithmen der gewählten Software. Es kann auch die Konformität der bestehenden Diagramme geprüft werden (check) oder ein Vergleich vorgenommen werden (compare). Auch eine Konsolidierung (promote) händisch und automatisch erstellter Diagramme ist möglich. Nach Abschluss des zweiten Schritts bestehen eng miteinander verzahnte Kontrollflussdiagramme und Ereignisprotokolle. Eine Interpretation der erstellten Kontrollflussdiagramme ist für die weiteren Schritte notwendig, insbesondere zur Beantwortung der Fragestellung oder zum Anstoßen eines Business-Process-Reengineerings.
  4. Erweiterung der Diagramme zum Modell: Im vierten Schritt wird das Kontrollflussdiagramm um weitere Perspektiven erweitert. Dies kann zum Beispiel eine aufbauorganisatorische oder eine zeitliche Perspektive sein. Als Ergebnis liegt ein integriertes Prozessmodell vor, das für verschiedene Anwendungen genutzt werden kann. Beispielsweise kann der dokumentierte Prozess mit Hilfe des Business-Process-Reengineering neu erstellt werden. Dies ist zwar prinzipiell bereits nach dem dritten Schritt möglich, aber erst nach der Integration weiterer Perspektiven hebt sich das Ergebnis des Process-Mining von herkömmlichen Modellierungsprodukten von Geschäftsprozessen ab. Beispielsweise kann die zeitliche Dimension dabei helfen, Engpässe zu erkennen. Die Perspektiven werden in der Literatur näher erläutert. (Aalst 2011, 11 und 215-240)
  5. Operative Unterstützung: Im Vergleich zur reinen Nutzung der Kontrollflussdiagramme nach dem dritten Schritt sind die vollständigen Prozessmodelle deutlich vielseitiger einsetzbar. Dies geschieht im fünften Schritt durch die Nutzung für Kartographie, Auditing und Navigation. Die operative Unterstützung (Navigation) ist im Vergleich zu den beiden anderen zukunftsgerichtet und soll bei der täglichen Durchführung des Prozesses unterstützen. (Aalst 2011, 241-258).

Abbildung 5: Übersicht der einzelnen Schritte beim Process-Mining (Aalst 2011, 284)

Abbildung 5: Übersicht der einzelnen Schritte beim Process-Mining (Aalst 2011, 284)

Im Rahmen des Data-Mining werden Daten mit Hilfe des ETL-Prozesses (engl. extraction, transformation, loading) zur weiteren Verwendung aufbereitet. Dabei werden die Datenbestände verschiedenster Anwendungen in einem Data-Warehouse konsolidiert. Dieses produziert selbst keine Daten, sondern sammelt und transformiert diese zur weiteren Verwendung, sodass die operativen Anwendungssysteme nicht belastet werden. Wenn beispielsweise verschiedene Anwendungen in einem Fertigungsauftrag involviert sind, können mithilfe des Data-Warehouses die Datensätze konsolidiert werden. (Aalst 2011, 97f)

Abbildung 6 zeigt exemplarisch ein Ereignisprotokoll (engl. event log) des beispielhaften Versicherungsprozesses der Grafiken 1 und 2. Zur Analyse muss ein Ereignisprotokoll einen spezifischen Prozess abbilden. Jedes Ereignis (event) ist dabei eine einzelne Prozessinstanz und jede Ausführung ist ein Fall (case). Jedes Ereignis ist zudem einer Aktivität (engl. activity) zugeordnet. In der Regel gehören zudem ein Zeitstempel (engl. timestamp) und die ausführenden Ressourcen (engl. resource) zum Umfang eines Ereignisprotokolls. Diese und weitere Bestandteile werden als Attribute bezeichnet. (Ein Prozess umfasst Fälle, die Ereignisse und Attribute enthalten.) (Aalst 2011, 98ff)

Abbildung 6: Ereignisprotokoll (Aalst 2011, 99)

Abbildung 6: Ereignisprotokoll (Aalst 2011, 99)

Ziel der Prozesserkennung ist die Umwandlung eines Ereignisprotokolls in ein Kontrollflussdiagramm. An dieser Stelle wird die Kontrollfluss-Perspektive im Rahmen der Aufgabe der Erkennung (discovery, Play-In) beschrieben. Dabei kann ein detaillierteres Schema (Petrinetz, BPMN usw.) den Prozess genauer abbilden. Das Diagramm sollte eine Ausgewogenheit zwischen verschiedenen Qualitätskriterien herstellen, welche zueinander im Widerspruch stehen und somit einen Interessenausgleich erfordern: (Aalst 2011, 125-128)

Ein häufig verwendeter Algorithmus für die oben dargestellte Aufgabe ist der α-Algorithmus, der ein Ereignisprotokoll als Eingabe verwendet. Der Algorithmus untersucht dies anhand spezifischer Muster. Wenn zum Beispiel auf Aktivität a regelmäßig Aktivität b folgt, aber auf b niemals a, kann man von einer Abhängigkeit ausgehen. Somit werden im Petrinetz die Knoten a und b von links nach rechts verbunden. Analysiert wird jeweils die Anordnung in einem Fall (engl. case). Für die Auswertung ist die chronologische Sortierung der Ereignisse (engl. event) notwendig; diese erfolgt im Rahmen der Datenaufbereitung in einem eigenen Schritt. (Aalst 2011, 129; Weber 2007, 19f)

![Abbildung 7: Typische Prozessmuster (Petrinetz) (abbildung-07-typische-prozessmuster-petrinetz.png)

Abbildung 7: Typische Prozessmuster (Petrinetz) (Aalst 2011, 131)

Der α-Algorithmus unterscheidet neben den beiden Funktionen Erster (first) und Letzter (last) zwischen vier verschiedenen Zusammenhängen der einzelnen Ereignisse: (Aalst 2011, 130)

Dabei ergeben sich die in Abbildung 7 dargestellten Prozessmuster. Grundsätzlich ist es nicht relevant, wie oft ein bestimmtes Prozessmuster im Ereignisprotokoll auftritt. Bei mindestens einem Auftreten wird der Sachverhalt in das Kontrollflussdiagramm aufgenommen. (Weber 2007, 22f)

Verschiedene Einschränkungen des α-Algorithmus und die sich daraus ergebenden unvollständigen oder fehlerhaften Kontrollflussdiagramme erfordern eine durchgehende Prüfung und Anpassung dieser Diagramme. (Aalst 2011, 136-139; Weber 2007, 14-18)

3 Software

Diese Arbeit dient neben dem allgemeinen Informationscharakter insbesondere der Vorbereitung des Projektseminars, in dessen Verlauf Daten von Systemen auf Basis der Radio-Frequency-Identification (RFID) ausgewertet werden sollen. Dazu wird eine Auswahl an Anwendungssoftware für das Process-Mining miteinander verglichen.

3.1 Auswahlkriterien

Als Grundlage für die Auswahl geeigneter Lösungen gilt es, relevante Vergleichs- und Auswahlkriterien festzulegen. Dabei werden insbesondere die Anforderungen des universitären Projektseminars berücksichtigt.

Kosten: Kommerzielle Software zur Datenanalyse kann schnell zu hohen Kosten führen. Die Anbieter bedienen primär die Anforderungen großer Unternehmen, die durch den Einsatz erhebliche Gewinnsteigerungen und/oder Kosteneinsparungen erwarten. Aufgrund fehlender Mittel zur Lizenzierung von Software im Rahmen des Projektseminars sollte die ausgewählte Software kostenlos verfügbar sein. Zahlreiche Unternehmen räumen Bildungseinrichtungen Softwarerabatte ein. Dahingehende Informationen sind häufig nicht öffentlich einsehbar, sondern nur auf Anfrage ermittlbar. Zu diesem Zweck werden kommerzielle Anbieter von Process-Mining-Software kontaktiert, um Informationen zur Lizenzierung für Bildungseinrichtungen zu erhalten.

Bereitstellung: Im Rahmen des Projektseminars wird nur in sehr geringem Umfang IT-Infrastruktur bereitgestellt. Insbesondere stehen Server zur Installation von Anwendungen nicht zur Verfügung. Als Windows-Clients werden private Notebooks eingesetzt. Daraus folgt, dass Software, die eine Serverinstallation erfordert, voraussichtlich nicht genutzt werden kann. Auf der anderen Seite ist eine schnelle Bereitstellung erforderlich, da aufgrund der begrenzten Laufzeit des Projektseminars eine langwierige Software-Einführung nicht sinnvoll erscheint. Schnell einsetzbare Cloud-Lösungen sind daher zu bevorzugen. Überdurchschnittliche Anforderungen hinsichtlich des Datenschutzes bestehen nicht.

Referenzen: Aufgrund der Einbettung des Projektseminars in ein Forschungsprojekt ist mit der anschließenden Weiterverwendung der Process-Mining-Software zu rechnen. Da die beteiligten Organisationen, Forschungseinrichtungen und Unternehmen weitergehende Analysen durchführen möchten und diese auch in wirtschaftlicher Hinsicht verwertbar sein sollen, ist praxisnahe Anwendungssoftware einzusetzen. Referenzen, welche diese bereits erfolgreich einsetzen, zeigen die kommerzielle Verwendung und den damit verfügbaren Support auf.

Funktionsumfang: Der schwierigste Untersuchungsgegenstand ist der Funktionsumfang. Alleine das Erstellen einer Liste an Funktionsmerkmalen kann sehr langwierig sein. Bei der Evaluation eines speziellen Aufgabenprofils kann die Aufgabe leichter ausfallen. Da für das Projektseminar bislang keine Analyseszenarien oder Testdaten zur Verfügung stehen, ist eine Prüfung des Funktionsumfangs nicht möglich.

Lernaufwand: Das Projektseminar wird innerhalb eines halben Jahres durchgeführt und anschließend abgeschlossen. In diesem Zeitraum müssen mit den bereitgestellten Daten und der Software nicht nur theoretische Ansätze, sondern auch praktische Erkenntnisse gewonnen werden. Zu diesem Zweck sollte insbesondere die Einarbeitung in die Anwendungssoftware schnell erfolgen. Zwar sind insbesondere Neuentwicklungen im Bereich der Datenanalyse für eine einfache Verwendung konzipiert, jedoch ist dies nicht selbstverständlich.

3.2 Lösungen und Analyse

Im Rahmen einer Webrecherche werden verschiedene Lösungen ermittelt. Tabelle 1 bietet einen Überblick über bekannte Lösungen.

Nr. Lösung Lizenz Infrastruktur
1 Celonis kommerziell On-premise oder Cloud
2 Fluxicon Disco kommerziell Desktop
3 Fujitsu Interstage kommerziell Suite
4 Lexmark Perceptive Process Mining kommerziell Suite
5 ProM Open Source Desktop
6 QPR ProcessAnalyzer (Xpress) kommerziell Cloud (Desktop)
7 SAP Operational Process Intelligence kommerziell Suite
8 Software AG Process Performance Manager kommerziell Suite

Tabelle 1: Übersicht über Process-Mining-Software

Kosten: Es ist ersichtlich, dass die meisten Lösungen kommerziell vertrieben werden. Nur das ProM Framework ist als Open-Source-Software kostenlos erhältlich. Der deutsche Anbieter Celonis bietet im Bildungsbereich Partnerschaften mit interessierten Hochschulen an. Bei einer solchen wird eine Cloud-Installation für wissenschaftliche Zwecke bereitgestellt. Für das Produkt QPR ProcessAnalyzer (Xpress) wurde eine Anfrage zur möglichen Lizenzierung für den Bildungsbereich gestellt (Stand: 17.10.2014).

Bereitstellung: Die Bereitstellung der Anwendungen erfolgt auf unterschiedliche Weise. Die meisten sind in eine Produktfamilie des Anbieters eingebettet. Dies sind insbesondere große Software- und Systemanbieter. Dabei wurden einige Produkte durch Unternehmensübernahmen in das bestehende Lösungsportfolio integriert. Verschiedene ergänzende Server- und Anwendungssysteme erfordern eine relativ komplexe Einführung der Produkte (3, 4, 7, 8). Produkte zur Installation auf dem Desktop können mit geringem Aufwand in Betrieb genommen werden (2, 5, 6). Bei Cloud-Lösungen wird die Serveranwendung vom Anbieter entweder als Multi-Tenant-Lösung oder als Managed Service bereitgestellt. Als Frontend kommt entweder eine Desktop-Software oder eine Webanwendung zum Einsatz (1, 6).

Referenzen: Das ProM-Framework ist aufgrund seiner allgemeinen Verfügbarkeit sowie des Umfangs und der Erweiterbarkeit durch Plug-Ins im akademischen Bereich die meistgenutzte Lösung. Die Entwicklung wird vom in dieser Arbeit häufig zitierten Wil van der Aalst an der Technischen Universität Eindhoven (Niederlande) geleitet. Celonis kommt als deutscher Anbieter insbesondere bei deutschen bzw. deutschsprachigen Unternehmen und Organisationen zum Einsatz.

Funktionsumfang und Lernaufwand: Der Funktionsumfang und der Lernaufwand werden im Rahmen des Projektseminars nach der Auswahl geeigneter Lösungen evaluiert.

3.3 Auswahl und Einführung

Aufgrund der Beschränkung auf kostenlose Tools kommen bislang Celonis und ProM in Betracht. Für QPR ProcessAnalyzer wurde der deutsche Vertriebspartner kontaktiert. (Stand: 17.10.2014). Im weiteren Verlauf des Projektseminars müssen die verschiedenen Lösungen praktisch evaluiert werden. Aufgrund der Zusammenarbeit sowohl akademischer als auch kommerzieller Partner im Rahmen des Projektseminars bietet sich die Kombination verschiedener Software-Tools an. So kann sichergestellt werden, dass die unterschiedlichen Interessen der Projektpartner berücksichtigt werden.

Die Einführung und Nutzung der Lösungen erfordern keinen erhöhten administrativen Aufwand. Als Desktop- oder Cloud-Software ist eine schnelle Nutzung möglich.

Darüber hinaus kann der Einsatz einer Softwarelösung zur Modellierung von Geschäftsprozessen sein. Zwar bieten die Lösungen die grafische Darstellung der Prozesse. Zur weiteren Verarbeitung, insbesondere in Kombination mit anderen Prozessen, könnte jedoch eine Überführung in eine andere Software erforderlich sein. Inwiefern dies im Rahmen des Projektseminars erforderlich wird, lässt sich zum Zeitpunkt der Fertigstellung dieser Arbeit nicht feststellen. Für die Modellierung von Geschäftsprozessen gibt es eine große Anzahl ausgereifter Softwarelösungen; insofern sollte eine Auswahl auch kurzfristig möglich sein.

4 Zusammenfassung und Fazit

Die Arbeit liefert zwei unterschiedliche Ergebnisse: Zum einen dient sie als Übersicht über das Thema Process-Mining, insbesondere im Vorgriff auf das Projektseminar. Es wird ein Überblick über das Thema sowie über die grundlegenden Vorgehensweisen gegeben. Der zweite Teil dieser Arbeit dient der Auswahl einer geeigneten Anwendungssoftware für das Process-Mining. Mit dieser sollen während des Projektseminars Ereignisprotokolle ausgewertet werden.

Process-Mining ist die Kombination von Prozessmanagement und Data-Mining. Im herkömmlichen Prozessmanagement werden Geschäftsprozesse händisch, beispielsweise durch Befragungen, modelliert. Im Falle des Process-Mining werden Ereignisprotokolle von Anwendungssystemen mit Hilfe spezieller Software-Tools automatisiert ausgewertet und die ermittelten Prozesse grafisch dargestellt. Dies ermöglicht eine deutlich verkürzte Analyse bestehender Prozesse. Am häufigsten wird diese Vorgehensweise zur Modellierung von Prozessen eingesetzt. Es sind jedoch auch weitere Nutzungsszenarien, etwa die Prüfung der Einhaltung definierter Prozesse, möglich. In Zeiten knapper werdender Budgets bedarf es neuer Ansätze zur effektiven und effizienten Modellierung von Geschäftsprozessen. Bei der Nutzung des Process-Mining im Rahmen des Geschäftsprozessmanagements ist eine deutlich schnellere Prozesserkennung und -modellierung möglich.

Trotz der noch jungen Domäne des Process-Mining existieren bereits verschiedene Softwarelösungen. Dabei ist aufgrund des Umfangs insbesondere ProM von besonderer Bedeutung. Als Referenzwerk der Wissenschaft dient es als Grundlage mehrerer wissenschaftlicher Arbeiten. Daneben konzentrieren sich verschiedene kommerzielle Lösungen auf die klassische Unterstützung im Geschäftsprozessmanagement, insbesondere in Verbindung mit ERP-Systemen. Das Projektseminar kombiniert wissenschaftliche und wirtschaftliche Ziele sowie Methoden. Die Berücksichtigung mehrerer Softwarelösungen ist nahegelegt.

Zusammen mit den Projektseminararbeiten anderer Studierender fasst diese Arbeit die theoretischen Grundlagen für das Projektseminar zusammen. Darüber hinaus wird eine Vorauswahl geeigneter Software für das Process-Mining vorgenommen. In Kombination mit einer zuvor vom Autor verfassten Seminararbeit zum Thema RFID und Big Data sind zudem weitere Anwendungsbereiche zur Auswertung von RFID-Daten denkbar.

Literaturverzeichnis