www.math-jobs.ch

Data Mining (www.acad.jobs)


Auf der Website Mathematik, Statistik und Anwendungen: Informationen zu Studium, Beruf, Anforderungen und Lage auf dem Arbeitsmarkt in der Schweiz beschreiben wir die häufigsten Arbeitsmöglichkeiten für MathematikerInnen. Auf dieser Website folgt eine ausführliche Beschreibung des Bereichs "Data Mining". Der folgende Text erschien in der NZZ vom 29. Oktober 1999 in der Rubrik "Medien und Informatik". Die acad.jobs AG dankt der NZZ und Herrn Dr. Bernhard Kunz und Frau Dr. Sibylle Peter von der Credit Suisse für die Bereitschaft, diesen Artikel bei uns zur Verfügung zu stellen.


Die goldene Nadel im Datenhaufen

Wie die Credit Suisse versucht, ihre Kunden besser kennenzulernen

Von Bernhard Kunz und Sibylle Peter

In Unternehmen liegt oft eine Fülle von Daten über die Kunden vor, das Wissen über diese ist jedoch nicht selten gering. Die Tatsache, dass nahezu alle Transaktionen im Wirtschaftsalltag über Computer ablaufen, führt zu einer raschen Vergrösserung der kundenbezogenen Datenbestände. Um diese auszuwerten, müssen sie zentral in einem Data Warehouse abgelegt werden. Für die Analyse empfehlen sich die Verfahren des Data Mining.

Die Umfeldbedingungen im Retail banking haben sich in den letzten zehn Jahren stark verändert: Der Markt ist weitgehend gesättigt und die Kundschaft gut informiert, mobil und damit weniger treu. Hinzu kommen ein verstärkter Wettbewerb durch ein höheres Mass an Professionalisierung der angestammten Firmen sowie das Eindringen von branchenfremden Anbietern. Folglich muss Kundenloyalität zu einem der zentralen Marketingziele avancieren. Die Credit Suisse (CS) hat vor diesem Hintergrund das Projekt Loyalty Based Management lanciert, das eine Erhöhung der Kundenbindung anstrebt.

Den Schlüsselfaktor für ein Unternehmen, das sich zum Ziel gesetzt hat, einen hohen Kundennutzen zu schaffen, bildet das Wissen über die Bedürfnisse und Verhaltensweisen seiner Klientel. Um dieses Wissen zu erlangen und strategisch zu nutzen, bedarf es einer systematischen Ablage und im Anschluss daran einer differenzierten Analyse von Kundendaten, möglichst auf individueller Ebene.

Aus Rohdaten Wissen gewinnen

Daten verkörpern in der Regel einzelne Messwerte ohne Kontextinformation. Zu Wissen und damit strategisch relevant werden Daten erst, wenn sie zueinander in Kontext stehen. Ausgehend von dieser Differenzierung, liegen in Unternehmen oft eine Fülle von Daten über die Kunden vor, das Wissen über diese hingegen ist oftmals gering. Dies hat nicht zuletzt damit zu tun, dass innerhalb eines Unternehmens Daten zwar permanent erfasst, aber nicht zentral abgelegt und gepflegt werden. Vielmehr existiert häufig eine Reihe von «Datenfriedhöfen».

Bei der Credit Suisse erachtete man es deshalb im Rahmen des Loyalty Based Management als notwendig, Kundendaten zentral in einem Data Warehouse abzulegen. Eine solche Zentralisierung der Daten bietet verschiedene Vorteile: Daten lassen sich alle auf einer gemeinsamen Plattform darstellen, und eine regelmässige Aktualisierung sowie der Zugriff auf die Daten werden erleichtert. Ferner ist ein erhöhtes Mass an Datensicherheit gewährleistet, was die Qualität der Analyse erhöht. Der Aufbau eines Data Warehouse ist jedoch ein schwieriger und langwieriger Prozess, der von hochspezialisierten Experten durchgeführt werden muss. Im Data Warehouse der CS befinden sich derzeit u.a. Kundenstamm-, Transaktions- und Zahlungsverkehrsdaten, Angaben über die Nutzung bestimmter Produkte sowie ähnliche Daten, insgesamt rund 1,5 TByte, wovon 600 MByte produktiv.

One-to-one-Marketing

Die zentrale und systematische Datenspeicherung bildet die Grundlage des Loyalty Based Management. Allerdings verspricht erst eine intelligente Analyse der darin abgelegten Daten mehr Wissen über die Kunden. Zur Auswertung grosser Mengen interner Daten werden Data-Mining- Verfahren eingesetzt. Data Mining umfasst eine Reihe von Verfahren der Statistik und der künstlichen Intelligenz, die grösstenteils auf einem induktiven, d.h. nicht oder nur wenig hypothesengeleiteten Vorgehen beruhen. Die Methoden im einzelnen (z.B. Cluster-Analyse, Decision Trees oder Neuronale Netze) sind als solche nicht neu, sondern wurden teilweise schon vor Jahrzehnten entwickelt; allerdings waren sie bisher überwiegend in einem eher naturwissenschaftlich geprägten Umfeld im Einsatz.

Ziel des Data Mining ist es, aus unternehmensinternen Daten durch geeignete Aufbereitung und Analyse Wissen zu extrahieren, das es erlaubt, das Verhalten von Individuen (beziehungsweise Systemen) zu prognostizieren. Der Grundgedanke vieler Data-Mining-Verfahren besteht darin, Merkmale zu identifizieren, die für ein bestimmtes Verhalten von Individuen ursächlich sind. Beispielsweise lässt sich mittels Data Mining feststellen, worin sich Kunden, die ein bestimmtes Produkt erworben haben, von denjenigen unterschieden, die das Produkt nicht besitzen. Die gewonnene Erkenntnis lässt sich einsetzen, um potentielle Neukunden zu identifizieren, die auf Grund ihrer Merkmalsstruktur eine hohe Wahrscheinlichkeit haben, das betreffende Produkt zu kaufen. Ferner wird Data Mining häufig eingesetzt, um eine Gruppe von Individuen auf der Basis von Ausprägungen bestimmter Merkmale in Subsegmente aufzuteilen, die dann wiederum gezielt und individuell mit Marketingmassnahmen kontaktiert werden. Im Extremfall besteht jedes Subsegment aus einem einzelnen Kunden, der dann mit einer individuell auf ihn zugeschnittenen Massnahme angesprochen wird. Diese Vorgehensweise wird in der Literatur dem Schlagwort One-to-one-Marketing subsumiert.

Das verstärkte Aufkommen von Data Mining im kommerziellen Umfeld liegt vor allem in den riesigen Datenbeständen begründet, über die Unternehmen heutzutage verfügen. Die Tatsache, dass nahezu alle Transaktionen im Wirtschaftsalltag über Computer ablaufen, führt zu einer permanenten Vergrösserung dieser Datenbestände. Die angehäuften Datenberge warten auf eine Verwertung. Für die Anwendung herkömmlicher statistischer Analyseverfahren sind die Datenmengen meist zu gross, oder die Bearbeitung geht nur sehr langsam vor sich. Data Mining hingegen eignet sich gerade für solche Volumina. Für Data- Mining-Analysen im Loyalty Based Management wird durchschnittlich auf einige 100'000 Kunden mit je 20 bis 200 Variablen pro Kunde zugegriffen. Die Hauptunterschiede zwischen traditioneller Statistik und Data Mining bestehen darin, dass Data Mining eher bei unternehmensinternen, grossen Datenbeständen (ab rund 50'000 Cases) und induktiv zum Einsatz gelangt, während klassische Datenanalyse eher bei kleinen Datenmengen Verwendung findet. Generell zwischen klassischer Statistik und Data Mining lässt sich allerdings keine klare Grenzlinie ziehen.

Wer Data Mining betreibt, ist zunächst mit dem Problem der Datenbeschaffung und -aufbereitung konfrontiert, das üblicherweise unterschätzt wird. Es ist jedoch nicht so, dass Data Mining nur mit unternehmensinternen Daten betrieben wird und etwa von der Marketingforschung isoliert abläuft. Vielmehr verspricht gerade die Kombination beider Bereiche einen Mehrwert an Wissen über die Kunden. Beispielsweise lassen sich unternehmensinterne Daten mit Befragungsdaten anreichern. Dadurch eröffnet sich für den Analysten gleichzeitig eine subjektive, nämlich vom Kunden selbst beurteilte, und eine objektive Sicht, die auf Verhaltensdaten beruht. Ein solcher Data Merge konfligiert unter Umständen aber mit Datenschutzrichtlinien. Zum einen ist darauf zu achten, dass das Bank- und Geschäftsgeheimnis eingehalten wird, zum anderen dürfen die berufsethischen Normen der Marketingforschung sowie die Bestimmungen zum Datenschutz nicht unterlaufen werden. Bei der CS werden diese Problemfelder dadurch gelöst, dass interne und externe Rechtsvertreter die Aktivitäten überwachen und jede Analyse bzw. Kampagne, die über das Data Warehouse läuft, auf ihre Rechtmässigkeit hin prüfen. Um Transparenz zu schaffen, wird das Data Warehouse beim eidgenössischen Datenschutzbeauftragten angemeldet.

Vorteile des Data Mining

Für Data Mining gibt es in Banken nahezu unerschöpfliche Anwendungsfelder. Neben den oben bereits beschriebenen Einsatzfeldern wie Cross Selling und Segmentierungsanalysen kann Data Mining u.a. auch für Credit and Risk Management oder Produktentwicklungen genutzt werden. Ein hauptsächliches Anwendungsgebiet in der CS ist das Data-Base-Marketing.

Im Rahmen einer Mailing-Kampagne war es das Ziel, unter den bisherigen Kunden der CS neue Interessenten für Bonviva zu gewinnen. Das Produkt Bonviva ist ein Dienstleistungspaket der CS zur Kundenbindung, das bestimmte Bankleistungen wie ein gebührenfreies Privatkonto und eine Gratis-EC-Karte mit Zusatzleistungen wie Schlüsselfundservice, Restaurant- und Hotelvergünstigungen verbindet. Der Erwerb des Produkts ist für Kunden an ein bestimmtes Anlagevermögen geknüpft. Die Kundenadressen für die Mailing-Kampagne wurden für einen Teil mittels Data Mining und für einen anderen Teil auf traditionelle Weise, d.h. auf der Basis von Erfahrungswerten, selektiert.

Bei der Data-Mining-Selektion wurde zunächst aus dem Kundenstamm eine Stichprobe mit derzeitigen Bonviva-Kunden gezogen. Auf Basis dieser Stichprobe wurden verschiedene Modelle entwickelt und getestet. Die Modelle dienten dazu, charakteristische Merkmale von Bonviva-Kunden sowie ihres Verhaltens zu identifizieren. Zu solchen Kriterien zählten u.a. Berufscode, Anzahl Transaktionen am Geldautomaten, Besitz eines Sparhefts sowie die Nutzung von Telebanking.

Nach der Evaluation verschiedener Modelltypen wurde ein Modell, das auf einem neuronalen Netz basiert, ausgewählt und auf eine neue Stichprobe mit Kunden, die Bonviva noch nicht besassen, angewendet. Damit liessen sich nun "prospects" identifizieren, die eine ähnliche Merkmalsstruktur aufwiesen wie die Bonviva- Kunden. Auf Grund dieser Tatsache konnte davon ausgegangen werden, dass bei diesen Individuen eine hohe Wahrscheinlichkeit bestand, sich für Bonviva zu interessieren. 10'000 der identifizierten «prospects» erhielten ein Mailing. Parallel dazu wurden aus dem Kundenstamm 2mal 10 000 Kunden mit Hilfe traditioneller Selektionsverfahren ausgewählt.

Die Resultate zeigten eine deutliche Überlegenheit der Data-Mining-Selektion. Bei gleicher inhaltlicher Gestaltung des Mailing war die auf Data Mining basierende Selektion sowohl hinsichtlich der Response- als auch der Abschlussquote deutlich erfolgreicher. Die Response-Quote übertrifft diejenige der traditionellen Selektion um rund 400 Prozent (460 Kunden bei der Data- Mining-Selektion gegenüber 130 Kunden bei der traditionellen Selektion), bei der Abschlussquote sind es sogar rund 800 Prozent (250 Kunden bei der Data-Mining-Selektion gegenüber 34 Kunden bei der herkömmlichen Selektion).

Nach Abschluss der Mailing-Kampagne wurden die Ergebnisdaten genutzt, um das ursprüngliche Modell noch zu verbessern. Letztlich konnte ein neuronales Netz entwickelt werden, das auf der Basis von 14 Variablen, die bestimmte Verhaltensmerkmale von Kunden beschreiben, das Response-Verhalten von potentiellen Interessenten prognostiziert. Unter Berücksichtigung der Tatsache, dass bei der Entwicklung des Mining- Modells etwa 150 Variablen analysiert wurden, bedeutet die Reduktion auf eine Anzahl von 14 eine extreme Vereinfachung und Beschleunigung. Das Beispiel zeigt den Verkauf eines Produkts innerhalb des Kundenstamms, was einer Cross-Selling-Massnahme gleichkommt. Prinzipiell ist es jedoch genauso denkbar, das gleiche Vorgehen zu nutzen, um ausserhalb des Kundenstamms der CS Interessenten für Bonviva zu identifizieren.

Zukunftsgerichtetes Wissensmanagement

Wie verdeutlicht, erweist sich das Wissen über die Klientel als zentraler Erfolgsfaktor im Loyalty Based Management. Data Warehousing und Data Mining sind unerlässliche Technologien in diesem Zusammenhang; Wissen lässt sich jedoch nur dann nutzbringend einsetzen, wenn es gelingt, dieses auch zu verwalten. Knowledge Management erfordert eine ganzheitliche Sicht in der Unternehmenssteuerung: Neben einem Data Warehouse, das lediglich Einzelinformationen im wesentlichen ohne Kontextverknüpfung enthält, braucht es ein System, das es erlaubt, Wissen jederzeit abzurufen und zu aktualisieren.

Webmaster: Dr. Christoph Luchsinger / chris@acad.jobs / www.acad.jobs AG