Zurück
KI-Corner 02/20
Natürliche Spracherkennung optimiert Banking
Social-Media-Daten liegen wie in Chats oft nur in natürlicher Sprache vor. Die Finanzwirtschaft setzt zur Erkennung KI-gestützte Verfahren ein. Informationen lassen sich dadurch besser und effizienter nutzen.

Untersuchungen der Unternehmensberatung Gartner (vgl. Gartner 2019) zeigen, dass zirka 80 Prozent der in Unternehmen vorhandenen Daten in unstrukturierter Form vorliegen (zum Beispiel PDF-Dateien, Office-Dokumente, Anrufprotokolle, Notizen, E-Mails). Das Internet mit Daten von mobilen Endgeräten, aus sozialen Netzwerken oder Multimediaplattformen ist auch für die Finanzbranche ein zusätzlicher wichtiger Daten-Pool.

Die darin verborgenen Informationen enthalten oft wertvolle Hinweise zu Meinungen, Vorlieben oder Problemen (potenzieller) Kunden. Dies gilt vor allem für Social-Media-Kanäle, weil immer mehr Kunden hier ihre Meinungen, Gefühle und Bedenken zu Produkten und Dienstleistungen äußern. Die stetig wachsende Zahl von Meinungsäußerungen anderer Nutzer spielt eine wichtige Rolle bei der Gestaltung von Produktwahrnehmungen und hilft Kunden bei Kaufentscheidungen.

Eine zentrale Herausforderung ist die in den meisten Informationsquellen vorliegende natürliche Sprache. Liegen Daten strukturiert in einer Datenbank vor, so sind sie leicht maschinell auswertbar und können durch geeignete Anwendungen in eine Form gebracht werden, die es dem Menschen erlaubt, einen Überblick zu gewinnen und Entscheidungen zu fällen. Die als Data Mining benannten Anwendungen erlauben den Zugang und die Bearbeitung strukturierter Informationen, sind jedoch nicht auf unstrukturierte Inhalte, wie sie im Internet zumeist vorliegen, sinnvoll einsetzbar.

Natural Language Processing (NLP) in Verbindung mit KI-Technologien ermöglicht eine effiziente, kostengünstige und qualitätsgesicherte Nutzung dieser weitgehend unerschlossenen Ressource. Damit können Banken und Sparkassen umfassende Quellen an unstrukturierten Informationen verarbeiten, sie nach Erkenntnissen und Informationen durchforsten, organisieren, verbinden, kontrastieren, verstehen und Fragen darüber beantworten.

Durch den NLP-Einsatz können Banken das Einhalten von Vorschriften und das Risikomanagement verbessern, die internen Betriebseffizienz steigern sowie Geschäftsprozesse optimieren. Nachfolgend werden die Funktionsweise von NLP-Techniken erläutert und ausgewählte Anwendungsfälle aus dem Finanzbereich vorgestellt.

Was ist NLP?

Natural Language Processing (NLP) ist ein Teilgebiet der künstlichen Intelligenz und bezeichnet Technogien und Algorithmen zur automatischen Analyse und Darstellung der menschlichen Sprache (vgl. Jurafsky and Martin 2014). Moderne NLP-Lösungen setzen dabei zunehmend Methoden der künstlichen Intelligenz (KI) wie Machine und Deep Learning ein, um auf Basis statistischer Modelle Inhalt und Struktur von Texten und gesprochener Sprache zu erkennen. Einsatzbereiche von NLP sind:

  • linguistische Textanalysen;
  • Stimmungs- und Meinungsanalysen (Sentimentanalyse);
  • maschinelle Übersetzungen (Google Translate und DeepL);
  • Rechtschreibprüfungen;
  • persönliche Assistenten (Siri, Cortana und Google-Assistent);
  • Chatbots.

Dabei kommen Technologien aus anderen Disziplinen zum Einsatz wie Computerlinguistik, statistische Sprachverarbeitung, Informationsextraktion, Information Retrieval, Mustererkennung, Machine- & Deep-Learning, Klassifikation und Cluster-Analyse (siehe Abb. 1). NLP lässt sich für folgende Aufgabenstellungen nutzen:

  • Content-Kategorisierung: Ordnet Text einem bestimmten vordefinierten Typ zu, mit dem Ziel einer Klassifizierung einschließlich Suche und Indizierung, Inhaltswarnungen und Erkennung von Duplikaten.
  • Themenerfassung und -modellierung: Analyse (längerer) Texte hinsichtlich Entitäten, Schlüsselworten, Kategorien, Stimmungen, Relationen und semantischer Rollen.
  • Kontextuelle Extraktion: Automatische Extrahierung strukturierter Informationen aus textbasierten Quellen (zum Beispiel Identifizierung von Charaktermerkmalen basierend auf Profildaten von Personen).
  • Sentimentanalyse: Identifikation von Stimmungen und subjektiven Meinungen innerhalb eines geschriebenen Texts (zum Beispiel die Stimmung eines Menschen hinsichtlich Emotion wie Ärger, Ekel, Furcht, Freude, Trauer), sozialer Ausrichtung wie offen, gewissenhaft, extrovertiert, introvertiert, freundlich, Sprachstil analytisch, zuversichtlich, zögernd sowie die emotionale Bandbreite.
  • Sprache-zu-Text- und Text-zu-Sprache-Konvertierung: Transformation von Sprachbefehlen in schriftlichen Text und umgekehrt.
  • Dokumentenzusammenfassung: Automatische Erzeugung von Zusammenfassungen aus umfangreichen Texten.
  • Maschinelle Übersetzung: Automatische Übersetzung von geschriebenem oder gesprochenem Text von einer Sprache in eine andere. Zusätzlich lässt sich die Sprache, in der ein Text verfasst wurde, automatisch erkennen.

Anwendungsbeispiele im Finanzbereich

Chatbots und virtuelle Agenten
Zahlreiche Banken bieten den Kunden Chatbots zur Überwachung von Konten und Transaktionen, Bezahlungen von Rechnungen oder Ausführung von Überweisungen an. Prädestiniert sind Chatbots für den Support und Service. Vor allem, wenn der Kunde schnell eine Standardfrage beantwortet haben möchte. Oft handelt es sich um Anwendungsfälle, für die es heute spezielle Apps oder Webseiten gibt.

Zentrale Elemente von Chatbot-Lösungen sind eine hinterlegte Wissensbasis (Datenbank) und die Komponente zur natürlichen Sprachverarbeitung. NLP interpretiert die Abfrage, entfernt unnötige Leerzeichen und Stopp-Worte. Das Ergebnis ist eine transformierte Abfrage zur anschließenden Konsultation der Datenbank – die sogenannte Wissensbasis. Bekannte Chatbot-Lösungen sind Linda, Vranzi oder Erica.

Eine Weiterentwicklung sind virtuelle Agenten, die unter Einsatz natürlicher Sprachverarbeitung Kundenprobleme lösen und Anfragen bearbeiten. Zum Beispiel können Bankkunden mit der virtuellen Assistentin Amelia von IPSoft in Echtzeit interagieren und diese sich aus Kundensicht weitestgehend wie eine menschliche Beraterin verhalten (Conversational Banking). Die Kunden können mit Amelia chatten und sie anweisen, Bankgeschäfte, Transaktionen oder allgemeine Kontoangelegenheiten zu erledigen.

Extrahierung von Informationen
Ein Beispiel zur Extraktion von Informationen mithilfe von NLP ist die von der US-amerikanischen JP-Morgan-Chase-Bank eingesetzte Lösung Coin. Dabei handelt es sich um eine maschinelle Lern-Software, die Juristen bei der Analyse großer Mengen juristischer Dokumente unterstützt. Die NLP-Lösung analysiert Dokumente nach von den Juristen vorgegebenen Attributen. Das System extrahiert die Bestandteile aus dem Vertrag und präsentiert sie einem menschlichen Prüfer. Nach eigenen Angaben konnte durch die neue Technologie eine Arbeitszeit von rund 360.000 Stunden eingespart werden.

Kreditwürdigkeitsprüfung
Ein weiterer Anwendungsbereich für NLP ist die Kreditwürdigkeitsprüfung bei Konsumentenkrediten. Aktuell nutzen Banken und Sparkassen Kredit-Scoring-Modelle, die mit einem zeitlich abgegrenzten Bestand von Transaktions- und Zahlungsdaten aus der Vergangenheit arbeiten. Diese Modelle ermitteln mit Regression, Entscheidungsbäumen und statistischen Analysen einen Kredit-Score.

Zusätzliche, unstrukturierte und halbstrukturierte Datenquellen einschließlich Social-Media-Aktivitäten, Mobiltelefonnutzung und SMS-Aktivitäten lassen eine differenziertere Sicht auf die Kreditwürdigkeit zu und machen das Rating genauer. Aufgrund der „Weitläufigkeit“ dieser Daten ist es für menschliche Analysten fast unmöglich, sie nach Kunden mit einer hohen Ausfallwahrscheinlichkeit zu durchforsten und diese zu identifizieren. NLP und maschinelles Lernen können Banken und Sparkassen dabei helfen, Social-Media-Posts, Internet-Browsing-Daten, Geolokalisierungsdaten und andere von Smartphones erfasste Informationen zu analysieren.

Neben der Erleichterung einer potenziell präziseren, segmentierten Beurteilung der Kreditwürdigkeit kann der Einsatz von KI unter Umständen einen besseren Zugang zu Krediten ermöglichen. Entsprechende KI-Lösungen von ZestFinance oder Lenddo versprechen schnellere Kreditentscheidungen bei gleichzeitiger Reduktion der Ausfallrisiken.

Produktentwicklung und Kundensupport
Durch eine Chatbot-Gesprächsanalyse, Kunden-Feedback-Formulare, Social-Media-Seiten und Transaktionshistorien kann ein Geldinstitut heute Absichten und Interessen von Kunden schneller und genauer erkennen. Die Royal Bank of Scotland (RBS) nutzt etwa NLP-Text-Mining-Techniken, um Trends aus dem Kunden-Feedback zu extrahieren. Die eingesetzte Software analysiert Daten aus Kunden-E-Mails, Umfragen und Callcenter-Gesprächen, um zu ermitteln, wo die größten Probleme für Kunden liegen.

Betrugserkennung und -bearbeitung
Bei der Prävention beziehungsweise Aufklärung von Betrugsfällen stehen die Institute vor der Herausforderung, eine Masse von Daten auswerten und zeitnah neue Betrugsmodelle identifizieren zu müssen. Mit NLP lassen sich betrügerische Transaktionen erkennen. Auffälligkeiten können dabei unter anderem verdächtige Beschreibungen (zum Beispiel in einer Online-Überweisung) sein. Im Bereich „Marktmanipulation“ können NLP-basierte Lösungen nicht-konforme Verhaltensmuster von Mitarbeitern im Handel mit Aktien und Wertpapieren aufdecken.

Bei der Verdachtsfallbearbeitung lassen sich mit NLP sinnvolle und flüssige Begründungstexte generieren. Darüber hinaus ist auch der Einsatz von NLP für vorgelagerte Entscheidungsprozesse (zum Beispiel Betrugsprävention) sinnvoll. KI-gestützte Lösungen können Systemmeldungen (Alerts) der Überwachungssysteme vorselektieren und Begründungen für „unkritische“ Fälle herausfiltern.

Klassifizierung von Wissen
Wie Unternehmen von Kunden, der Öffentlichkeit und den Medien wahrgenommen werden, hat innerbetrieblich einen hohen Stellenwert. Investor Relations, Corporate Communications und Marketing & Branding sind wesentliche Faktoren für eine positive Wahrnehmung der Marke und den wirtschaftlichen Erfolg. Eine regelmäßige Prüfung öffentlich zugänglicher Quellen wie Internet und Nachrichten-Feeds schützt vor möglichen Reputationsschäden.

Mit einer NLP-gestützten Ereignisextraktion verfügen Banken und Finanzinvestoren über ein leistungsfähiges Instrument, um das geschäftliche Ökosystem betrachteter analysieren zu können. Mit NLP-Techniken lassen sich demzufolge Beschäftigungsänderungen, Geschäftsabschlüsse und alles andere, was mit Organisationen oder Personen passiert, automatisch extrahieren und in einer strukturierten Datenbank speichern. Zum Beispiel kann „Anshu Jain, der als Vorstandsvorsitzender Deutschen Bank zurücktritt“ geparst werden als: {Unternehmen: Deutsche Bank, Stellung: Vorstandsvorsitzender, Person: Anshu Jain, Ereignis: Ende der Beschäftigung}.

 

Wie funktioniert NLP?

NLP basiert allgemein auf vier Prozessschritten:

  • Suche;
  • Vorverabeitung;
  • Analyse;
  • Extrahierung/Mustererkennung.

Schritt 1
Im ersten Schritt werden durch Techniken des Information Retrieval zur Anfrage passende Dokumente gesucht. Das Ergebnis ist ein Textkorpus, welcher aus mehreren Dokumenten besteht. Ein Textkorpus wären etwa alle relevanten Dokumente zum Thema „NLP im Finanzbereich“. Die einzelnen Dokumente bestehen aus Kapiteln, Absätzen und Sätzen.

Schritt 2
Diese werden im nächsten Schritt linguistisch so vorverarbeitet, dass die in der Sprache verwendete generische Struktur aus Sätzen, Phrasen und Worten automatisiert erkannt und verarbeitet werden kann.

Schritt 3
Im dritten Schritt, der semantischen Analyse, werden Entitäten im Text gesucht und entsprechend markiert. Bei Entitäten handelt es sich um Eigennamen, die Orte, Organisationen, Personen usw. beschreiben und mittels Named-Entity-Recognition erkannt werden. Abbildung 2 zeigt eine Entitäten-Analyse mit der Natural-Language-Processing-API von Google.

Schritt 4
Im letzten Schritt werden die so vorverarbeiteten Dokumente miteinander in Beziehung gesetzt, um gezielt Informationen mit Mustererkennungsalgorithmen zu extrahieren.

Fazit

Indem sie natürliche Sprache verarbeiten, können Banken und Sparkassen Aufgaben wie das Sammeln von Kundeninformationen und die Suche nach Dokumenten automatisieren und optimieren. Chatbots sind derzeit die am weitesten verbreiteten NLP-Anwendungen in der Finanzwirtschaft. Mit Chatbots sind bestimmte Bankleistungen orts- und zeitunabhängig stets erreichbar. Banken können ohne zeitliche Begrenzungen mit den Kunden interagieren und viele Standardfragen beantworten. Die Echtzeit-Funktionalitäten prädestinieren Chatbots für den Einsatz an den Kontaktpunkten am Point of Sale (PoS).

Eine wesentliche Herausforderung bei allen KI-Anwendungen ist die mangelnde Datenqualität. Um falsche Schlüsse zu vermeiden, müssen neben möglichst viele Beispielaussagen auch die Vertraulichkeit der Datenquellen, deren Aktualität und Relevanz vorab geprüft werden.

Literatur
Erica: Startseite: URL https://promo.bankofamerica.com/erica/ (Stand: 10.02.2020).
Gartner (2019): Market Insight: How to Dominate the Unstructured Data Market, Startseite: URL https://www.gartner.com/en/documents/3902670/market-insight-how-to-dominate-the-unstructured-data-mar (Stand: 10.02.2020).
IPSoft (2020) Amelia, Startseite: URL https://www.ipsoft.com/amelia/ (Stand: 13.02.2020).
Jurafsky, D. and Martin, J. H. (2014): Speech and language processing, volume 3. Pearson, London.
Lenddo (2020) The LenddoScore, Startseite: URL https://lenddo.com/ (Stand: 13.02.2020).
Linda: Startseite: URL https://www.sparkassen-finanzportal.de/news/Chatbot-Linda-in-der-Chat-Suite_.html (Stand: 10.02.2020).
VRanzi: Startseite: URL https://www.vr-bank-westmuensterland.de/service/vranzi-service-bot-und-chat.html (Stand: 10.02.2020).
Reiter, E.; Dale, R (2000): „Building Natural Language Generation Systems“, Cambridge: Cambridge University Press.
Zest (2020) ZestFinance, Startseite: URL https://www.zest.ai/solutions (Stand: 13.02.2020).

Autor
Prof. Dr. Dirk Neuhaus, MBA ist Professor für Informationssysteme in Finanzdienstleistungsunternehmen an der Hochschule der Sparkassen-Finanzgruppe in Bonn und forscht auf dem Gebiet der künstlichen Intelligenz.

Prof. Dr. Dirk Neuhaus
– 21. Februar 2020