Die zunehmende Digitalisierung sowie die allgegenwärtige Verfügbarkeit von Daten verändern das Wirtschaftsleben, den Alltag des Einzelnen und die Gesellschaft als Ganzes. Vor diesem Hintergrund wird der Einsatz von maschinellen Lernverfahren in vielen Bereichen von Wirtschaft und Gesellschaft zum Teil kontrovers diskutiert. Mit Hilfe des Einsatzes solcher Algorithmen lassen sich beispielsweise Prognosen verbessern sowie Entscheidungen bzw. Entscheidungsprozesse automatisieren. In diesem Artikel geben wir zum einen einen Überblick über die Grundprinzipien maschinellen Lernens. Zum anderen diskutieren wir Anwendungsmöglichkeiten sowie Wirtschaftlichkeitspotenziale am Beispiel von Kundenbindungsprozessen.
The increasing digitalization, as well as the ubiquitous availability of data, are currently transforming the economy, the lives of consumers, and society in general. In this context, the use of machine learning is often controversially debated by businesses and the public. For example, these algorithms can help improve making predictions and help automate decisions and decision making processes. In this paper, we first provide an overview of the basic concepts of machine learning and secondly, we will examine selected use cases and efficiency potentials within the customer retention processes.
Die Digitalisierung der Wirtschaft bedroht vielfach traditionelle Unternehmen, welche vermehrt mit disruptiven Ideen aufstrebender Neuankömmlinge im Wettbewerb stehen und sich oftmals aufgrund ihrer Größe und Komplexität nur langsam anpassen oder Innovation betreiben können (Christensen 1997). Allerdings bieten sich gleichzeitig auch Chancen, die bestehenden Geschäftsmodelle und -prozesse dahingehend zu transformieren bzw. neue zu entwickeln, dass weiterhin ein Wettbewerbsvorteil generiert werden kann (Chesbrough 2007; Osterwalder und Pigneur 2010). Insbesondere die fortschreitende Prozessautomatisierung wird dabei als wesentlicher Faktor der digitalen Transformation aufgeführt (World Economic Forum 2016; McKinsey 2017). Das primäre Ziel steigender Automatisierung ist es, Effizienz‑, Effektivitäts- und Qualitätsverbesserungen zu realisieren (Damm und Kalmar 2017). Informationssysteme, wie Enterprise Resource Planning (ERP) und Customer Relationship Management (CRM), sind bereits seit Jahrzehnten in Unternehmen etabliert und unterstützen den Kundenbeziehungszyklus. Nicht zuletzt aufgrund der zunehmenden Vernetzung von Menschen (soziale Medien), Maschinen (Industrie 4.0) und Systemen (z. B. Cloudcomputing) steigt das globale Datenvolumen exponentiell (Huber 2016). Technologien, wie Big Data, ermöglichen es, dieses große Datenvolumen zu verarbeiten, zu analysieren und zu speichern (Schroeck et al. 2012). In Kombination mit besseren Algorithmen im Bereich künstlicher Intelligenz sowie verteilter, paralleler Datenverarbeitung wird darüber hinaus die Grundlage für Maschinelles Lernen geschaffen (Kelly 2014).
In Folge dessen entsteht eine neue Klasse „intelligenter Systeme“, die durch Fähigkeiten, wie beispielsweise Kognition (Kelly und Hamm 2013), weitere Teile bislang manuell ausgeführter Tätigkeiten übernehmen und dabei Probleme selbstständig und effizient lösen können (Mainzer 2016), ohne dass die explizite Programmierung derselben erforderlich ist. Diese intelligenten Systeme ermöglichen es, Signale und Muster in strukturierten, semi-strukturierten als auch unstrukturierten Daten zu erkennen sowie diese zu analysieren (Hurwitz et al. 2015; Reeves und Ueda 2016). Das Hauptmerkmal dieser Systeme ist dabei die sogenannte „schwache künstliche Intelligenz“, welche die Lösung eng definierter, hochspezialisierter Probleme (wie beispielsweise das autonome Fahren oder das Stellen medizinischer Diagnosen) bezeichnetFootnote1 (Pennachin und Goertzel 2007) und hierdurch den Anschein erweckt tatsächlich intelligent zu sein oder intelligent zu agieren (Russell und Norvig 2010). Dennoch sind intelligente Systeme nicht nur bereits vielfach den bisherigen von Menschen programmierten Systemen überlegen, sondern auch den menschlichen Fähigkeiten selbst – teilweise bereits bei Aufgaben, die aufgrund von Kreativität und Komplexität bislang nicht automatisierbar waren (Brynjolfsson und McAfee 2017). Ein interessantes Anwendungsbeispiel ist die Optimierung von Kundenbeziehungen (Watson 2017). Aufgrund der Verfügbarkeit von großen Datenmengen sowie der steigenden Bedeutung der Kundenfokussierung sind die Bereiche der Kundenidentifizierung, -anziehung, -bindung und -entwicklung für die Anwendung von intelligenten Systemen grundlegend geeignet (Ngai et al. 2009). Da insbesondere die Loyalität der Kunden eine positive Auswirkung auf die Unternehmensprofitabilität hat (Buckinx und Van den Poel 2005), bergen intelligente Systeme ein erhebliches Potenzial im Kundenbindungsprozess. Vor diesem Hintergrund wird der Fokus in diesem Beitrag auf den Einsatz von Maschinellen Lernverfahren im Kundenbindungsmanagement gelegt mit dem Ziel die verschiedenen Anwendungsfelder sowie die damit verbundenen Optimierungsmöglichkeiten aufzuzeigen.

In diesem Kontext rückt die Änderung der Arbeitsteilung zwischen Mensch und Maschine (Softwaresystem) stärker in den Fokus der Diskussion (Bitkom 2017). Dabei wird der Übergang von entscheidungsunterstützenden hin zu entscheidungsautomatisierenden Aufgaben in Anlehnung an SAE International (2016) beschrieben (siehe Abb. 1): Innerhalb eines manuellen Systems nimmt der Mensch (Benutzer) dauerhaft alle anfallenden Aufgaben und Entscheidungen zur Zielerreichung selbst wahr, ohne dass ein Softwaresystem vorhanden oder involviert ist (Stufe 0). Auf der ersten Automatisierungsstufe unterstützt das System hingegen den Menschen bereits bei der Ausführung definierter Aufgaben, während der Mensch die Kontrolle darüber behält und Entscheidungen zur Zielerreichung selbst trifft (z. B. ERP-Systeme der 1960er- bis 1990er-Jahre). Systeme auf der zweiten Stufe übernehmen die Ausführung definierter Aufgaben, während die Kontrolle darüber beim Menschen verbleibt und dieser die Entscheidungen zur Zielerreichung selbst übernimmt (z. B. Internet- und Microservicesarchitektur der 2000er- bis 2010er-Jahre) (SAE International 2016; Bitkom 2017). Der Mensch übernimmt unter dem Schlagwort „Human-in-the-Loop“ neben der Anwendung auch die Kontrolle über das System und trifft alle relevanten Entscheidungen (Damm und Kalmar 2017)

Allerdings wird sich die Aufgabe des Menschen mittelfristig stärker hin zur Überwachung intelligenter Systeme (Stufe 3) entwickeln, bei der der Mensch im Fehlerfall einschreiten kann bzw. muss (Committee on Technology National Science and Technology Council 2016). Jedoch nimmt diese Anforderung mit steigender Automatisierung (hin zu Stufe 4) stetig ab. Davenport und Kirby (2016) beschreiben vier Ebenen der Intelligenz solcher Systeme: Unterstützung für Menschen, Automatisierung repetitiver Aufgaben, Kontextbewusstsein und Lernen, sowie Selbstbewusstsein, wobei das Erreichen der Letzteren durch starke künstliche Intelligenz realisiert wird (Pennachin und Goertzel 2007). Letztlich werden diese Systeme der fünften Stufe autonom, ohne jegliche Eingabe und Kontrolle des Benutzers, agieren, ihre Umgebung analysieren und basierend auf den gewonnenen Erkenntnissen selbständig entscheiden (Fachforum Autonome Systeme 2017). Zudem sind sie in der Lage, auch selbstheilende Funktionen auszuführen, um das vorgegebene Ziel zu erreichen sowie die zur Ausführung einer Aufgabe erforderlichen Fähigkeiten mittels Maschinellem Lernen selbständig zu erwerben und zu optimieren (Wahlster 2017).

Insbesondere der Übergang von menschlicher hin zu systemgetriebener Entscheidung wird dabei als ein bedeutsamer, evolutionärer Schritt wahrgenommen, der gegenwärtig durch die Einbettung Maschinellen Lernens in Unternehmenssysteme zu beobachten ist (z. B. IBM 2017; Salesforce 2017; SAP 2017b). Allerdings ergeben sich hieraus zugleich auch Risiken geringer Akzeptanz solcher Systeme, da durch die zugrundeliegende Technologie des Maschinellen Lernens Entscheidungen für den Menschen nicht mehr zwingend nachvollziehbar oder transparent sind (Davenport und Kirby 2016; Brynjolfsson und McAfee 2017). Damm und Kalmar (2017) verweisen in diesem Zusammenhang auf einen Bericht des Europäischen Parlaments (2017), in dem u. a. explizit diese Transparenz sowie Nachvollziehbarkeit der durch künstliche Intelligenz getroffenen Entscheidungen für den Menschen gefordert werden. Basierend auf der Automation des Entscheidens (siehe Abb. 1) folgt daher zunächst eine Übersicht der zugrundeliegenden Konzepte des Maschinellen Lernens sowie die anschließende Betrachtung dieser im Kontext des Kundenbindungsprozesses. Anhand von Anwendungsbeispielen aus Wissenschaft und Praxis werden die Zusammenhänge erläutert und das Potenzial Maschineller Lernmethoden praxisnah dargestellt.

Grundlagen des Maschinellen Lernens
Maschinelles Lernen ist ein Teilgebiet der künstlichen Intelligenz und ist als etabliertes Forschungsgebiet seit Jahrzehnten durch einen rasanten technologischen Fortschritt geprägt. Der Begriff der künstlichen Intelligenz, welcher während der Dartmouth Conference im Jahr 1956 erstmals von Minsky, McCarthy, Newell und Simon definiert wurde, beschreibt Maschinen, die sich verhalten, als würden sie über eine Art menschliche Intelligenz verfügen (McCarthy et al. 1955). In den Folgejahren hat sich daraus das Teilgebiet Maschinelles Lernen etabliert, wobei die eigentliche Entwicklung von komplexen Algorithmen des Maschinellen Lernens erst in den 90er-Jahren voranschritt (Russell und Norvig 2010; Nilsson 2014). Einer der Schlüsselerfolge von Maschinellen Lernverfahren wurde im Jahre 2016 erzielt, als AlphaGo, ein von Google entwickeltes Computerprogramm, erstmalig einen professionellen Go-Spieler besiegte (Silver et al. 2016). Dieser Sieg wurde jedoch von Experten im Bereich der künstlichen Intelligenz laut einer Oxford-Studie erst für das Jahr 2027 prognostiziert und übertrifft somit jegliche Erwartungen (Grace et al. 2017). Die rasante technologische Weiterentwicklung zeigt sich ebenfalls durch die erst im Oktober 2017 veröffentlichte neue Version AlphaGo Zero. Dabei wird das Computerprogramm lediglich mit den Grundregeln des Go-Spiels ausgestattet und erlernt und entwickelt selbstständig iterativ neue Spielzüge. Hierdurch konnte AlphaGo Zero die letzte Version nach nur drei Tagen erfolgreich besiegen und erweitert somit die bekannten menschlichen Spielzüge (Silver et al. 2017).

Im Allgemeinen umfasst der Begriff Maschinelles Lernen Methoden, die mithilfe von Lernprozessen Zusammenhänge in bestehenden Datensätzen erkennen, um darauf basierend Vorhersagen zu treffen (Murphy 2012). Das Grundkonzept von Maschinellen Lernverfahren definiert Mitchell als „A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E“ (Mitchell 1997, S. 2). Im Wesentlichen bedeutet dies, dass ein Modell aufgrund der selbstlernenden Algorithmen und der existierenden Daten zukunftsrelevante Rückschlüsse ziehen kann, ohne diese explizit zu programmieren. Als Grundlage für diese Lernprozesse dienen Instanzen als Dateneingabe, die sich durch eine vordefinierte Reihe an Attributen charakterisieren. Dabei kann es sich um kontinuierliche, kategorische oder binäre Werte der Attribute handeln (Murphy 2012; Witten et al. 2017).

Maschinelle Lernverfahren werden u. a. in folgende Kategorien gegliedert: überwachtes (eng. supervised learning), unbewachtes (eng. unsupervised learning) und bestärktes Lernen (eng. reinforcement learning) (Russell und Norvig 2010). Sofern ein dedizierter Ausgabewert definiert ist, kann durch überwachte Maschinelle Lernverfahren das Modell dahingehend trainiert werden, dass der Ausgabewert bei einem bisherigen unbekannten Datensatz – dem Test Set – vorhergesagt wird. Im Allgemeinen besteht das eigentliche Ziel des überwachten Lernens darin, die Genauigkeit dieser Vorhersagen zu maximieren. Die zweite Kategorie des Maschinellen Lernens wird vor allem dann angewandt, wenn ein Datensatz keine präzisen Ausgabewerte aufweist. Daher können durch die Anwendung von unbewachten Maschinellen Lernalgorithmen basierend auf den Eingabedaten bisher unbekannte Muster und Zusammenhänge abgeleitet werden. Bei der zuletzt genannten Kategorie, dem bestärkten Lernen, basiert der Lernprozess des Algorithmus auf den Formen der Belohnung und Bestrafung mit dem Ziel, den Nutzen zu maximieren (Russell und Norvig 2010; Murphy 2012; Marsland 2015). Aufgrund des hohen Akzeptanzgrades der ersten Kategorie werden im Folgenden die verschiedenen Methoden und Anwendungsfälle des überwachten maschinellen Lernens aufgezeigt und erläutert (Brynjolfsson und McAfee 2017).

Ziel des überwachten Lernverfahrens ist es, den Ausgabewert anhand der vorhandenen Eingabewerte – den Attributen – mit einer möglichst hohen Genauigkeit vorherzusagen. Um dieses Ergebnis an bisher unbekannten Daten validieren zu können, wird der gesamte Datensatz in ein Training Set und ein Test Set aufgeteilt. Der eigentliche Lernprozess zur Vorhersage der Zielvariable basiert auf dem Training Set, wohingegen die Evaluierung dieses trainierten Modells mithilfe des Testdatensatzes erfolgt. Dadurch kann sichergestellt werden, dass die Bewertungsgrößen, wie Genauigkeit und Fehlerquote, anhand bisher unbekannter Daten bestimmt werden (Russell und Norvig 2010; Murphy 2012; Marsland 2015). Zudem ist anzumerken, dass innerhalb des Training Sets die Hyperparameter des Lernalgorithmus anzupassen sind, um die Leistung des Modells zu steigern. Eine gängige Methode zur Messung dieser Anpassungen ist die k‑fache Kreuzvalidierung, die das Training Set in k Untermengen teilt. Da das Modell auf den k−1 Untermengen trainiert und mit der verbleibenden Teilmenge validiert wird, kann der Durchschnitt der Bewertungsgrößen über die k‑fachen Durchläufe gebildet werden und stellt somit einen verlässlichen Leistungsindikator dar (Kohavi 1995). Bevor der eigentliche Lernalgorithmus selektiert und eingesetzt wird, ist aus Gründen der Datenqualität der Prozess der Datenvorverarbeitung anzuwenden. Die dabei verwendeten Methoden dienen vor allem der Bereinigung von fehlerhaften Daten, bestehenden Ausreißern und fehlenden Werten (Batista und Monard 2003). Zudem kann die Genauigkeit der Ergebnisvorhersage durch Verfahren der Feature Selection erhöht werden, da irrelevante und überflüssige Attribute entfernt werden, welche anderenfalls das Ergebnis irreführend beeinflussen würden (Yu und Liu 2004).

Die Auswahl des Lernalgorithmus hängt speziell von dem zu lösenden Problem des überwachten Maschinellen Lernens ab. Sofern die Zielvariable einen diskreten Wert darstellt, handelt es sich um ein Klassifikationsproblem, da bisher unbekannte Instanzen aufgrund der vorhandenen Attribute den Klassen der Ausgabewerte zuzuordnen sind. Dahingegen charakterisiert sich das Regressionsproblem durch die Vorhersage einer kontinuierlichen Zielvariable, die eine reelle Zahl darstellt (Murphy 2012; Marsland 2015). Anhand dieser zwei Verfahren des überwachten Maschinellen Lernens – Klassifikation und Regression – lassen sich für Unternehmen und Institutionen eine Vielzahl an Lernaufgaben bewältigen. Um das hohe Potenzial an überwachten Lernverfahren im Unternehmensumfeld und in verschiedenen Industrien aufzuzeigen, werden im Folgenden verschiedene Anwendungen genannt, die sich hierfür insbesondere eignen (siehe Tab. 1). Im Bereich der Finanzdienstleistung können beispielsweise durch die Anwendung von überwachten Lernverfahren die Entscheidungsprozesse der Kreditvergabe optimiert sowie Aktienkurse analysiert werden (z. B. Kruppa et al. 2013; Patel et al. 2015). In der Fertigungsindustrie beziehen sich die Anwendungsfälle des Maschinellen Lernens vornehmlich auf Fehlertypenerkennung und prädiktive Wartung von Anlagen und Maschinenkomponenten, um die hochkomplexen Prozesse der Experten zu automatisieren (z. B. Yin et al. 2014; Susto et al. 2015). Im Bereich der Bildklassifikation wurde durch den Einsatz von Maschinellen Lernverfahren ein erheblicher Fortschritt erzielt. Neben der Erkennung von allgemeinen Objekten, wie Tieren oder Pflanzen in Bildern, profitieren vor allem Bereiche, wie soziale Medien sowie Überwachung- und Sicherheitssysteme, durch die eindeutige Identifikation von Personen und Bestimmung von Emotionen (z. B. Murphy 2012). Ein weiteres weitverbreitetes Anwendungsgebiet ist die Klassifizierung von Dokumenten in Form von Artikeln, Textabschnitten oder Websites, die beispielsweise der Zuordnung von Web Spam, Rechnungen, Verträgen und Kundenbewertungen dienen (z. B. Guzella und Caminhas 2009; Murphy 2012). Sofern die Bild- und Textanalyse in Betracht gezogen wird, hat sich das Maschinelle Lernen ebenfalls stark in der Medizin etabliert, da u. a. anhand von medizinischen Bildern und Texten Krankheitsdiagnosen, wie Krebserkrankungen prognostiziert werden können (z. B. Litjens et al. 2017). Neben der Bild- und Textverarbeitung zählt außerdem die Spracherkennung zu einem Fokusbereich, bei dem Tonaufzeichnungen in Text übersetzt werden. Dieses Gebiet hat sich insbesondere durch die Entwicklung der personellen virtuellen Sprachassistenten, wie Siri (Apple 2017), Alexa (Amazon Developer 2017) und Google Now (Google 2017), im Markt etabliert
