Aufrufe
vor 2 Jahren

KINOTE 02.2021

  • Text
  • Wwwbankverlagde
  • Effizienz
  • Unternehmen
  • Roboter
  • Prozesse
  • Einsatz
  • Beispielsweise
  • Automatisierung
  • Treffer
  • Transaktionen
  • Banken
Um einen Wandel der Finanzbranche erfolgreich zu meistern, müssen Kreditinstitute sowohl Chancen als auch Herausforderungen der Künstlichen Intelligenz (KI) erkennen. Unter der neuen Marke KINOTE der Bank-Verlag GmbH finden Sie Meldungen, Studien und Fachartikel zum Themenkomplex KI. Wir beantworten Ihre Fragen rund um KI. Wir berichten über Trends, neue Technologien, Forschungsergebnisse und daraus entstehende Möglichkeiten, die KI Ihrem Unternehmen bietet.

32 02 | 2021 2.

32 02 | 2021 2. Distanz-Algorithmen hingegen vergleichen direkt das Schrift - bild der zu untersuchenden Wörter. Hierzu gehört beispielsweise der Levenshtein-Distanz-Algorithmus, der die minimale Anzahl von Einfüge-, Lösch- und Ersetzungs-Operationen berechnet, die benötigt werden, um ein Wort in ein anderes zu transformieren. Eine spezielle Art von Distanz-Algorithmen sind Token- oder sequenzbasierte Algorithmen, die die Zeichenkette in kleine Teile (Tokens) oder Sequenzen zerteilen und auf Basis dieser eine Ähnlichkeit berechnen. Beispiele hierfür sind auf n-Gramen basierende Algorithmen oder der Longest-Common-Substring-Algorithmus. Jeder Algorithmus ist für das Erkennen spezieller Muster besonders gut geeignet, versagt jedoch bei der Erkennung anderer Muster. So kann beispielsweise durch den Levenshtein- Algorithmus ein einfaches Vertauschen zweier Buchstaben sehr leicht erkannt werden. Die unterschiedlichen Schreibweisen eines Namens wie beispielsweise „Meier, Meyer, Mayer, Mayr“ können hingegen durch einen phonetischen Algorithmus deutlich besser erkannt werden. Damit ein Lernalgorithmus aus den Trainingsdaten ein Modell erstellen kann, werden sogenannte Features benötigt. Features bilden die verschiedenen Arten von Ähnlichkeit der zu untersuchenden Paare auf maschinenlesbare Werte ab. So können die Vorteile der unterschiedlichen Ähnlichkeitsalgorithmen kombiniert werden. Der ML-Algorithmus lernt dann diese Werte so zu interpretieren, dass er zwischen Treffern und Nicht-Treffern unterscheiden kann. Je besser die Features die gesamte Information über die Ähnlichkeit der zu vergleichenden Paare abbilden, desto besser kann das Modell lernen, risikobehaftete Transaktionen zu erkennen. Trainingsdaten sind das A und O Ein Machine-Learning-Modell ist nur so gut wie die Daten, aus denen es lernt. Beim sogenannten überwachten Lernen wird für das Training ein Set aus gelabelten Daten benötigt. Das bedeutet im Fall des Payment Screenings eine Kombination aus Transaktionen und Sanktionslisten-Einträgen, bei denen definiert ist, ob die Kombination zu einem Treffer führen soll oder nicht. Um eine möglichst hohe Effektivität zu erreichen, ist es entscheidend, dass die Lerndaten möglichst alle Muster abdecken, die auch später von dem Modell gefunden werden sollen. Für eine hohe Effizienz ist es jedoch ebenso wichtig, ausreichend Trainingsdaten zu definieren, bei denen die Ähnlichkeit nicht zu einem Treffer führen soll. Nur so kann das System lernen, zwischen risikobehafteten und unbedenklichen Transaktionen zu unterscheiden. Daher wurde bei der Erstellung geeigneter Lerndaten auf die Erfahrung der VP Bank Gruppe und weiterer Partner gesetzt. So konnte ein standardisiertes Machine-Learning- Modell trainiert werden. Der Aufwand der Modellentwicklung konnte gering gehalten werden, da verschiedene Partner mitgearbeitet haben und ihre Expertise einbringen konnten. Diese Punkte sind entscheidend für die Wirksamkeit des Machine-Learning-Modells: 1. Lerndaten, die alle zu erkennenden Muster ausreichend abdecken 2. Lerndaten, die trotz einer gewissen Ähnlichkeit nicht zu einem Treffer führen sollen 3. Features, die alle zur Erkennung der Muster nötigen Ähnlichkeits-Informationen in maschinenlesbare Werte abbilden 4. Auswertung und Optimierung der Parameter Effektivität von externen Dritten testen lassen Damit das System auch den aktuellen Anforderungen der Aufsichtsbehörden genügt, empfiehlt es sich, die Effektivität zusätzlich von einem unabhängigen Dritten überprüfen zu lassen. Wirtschaftsprüfungsgesellschaften oder Unternehmensberatungen liefern hierfür die Testdaten. Diese Informationen beruhen in der Regel auf synthetischen Daten und können daher bei verschiedenen Instituten eingesetzt werden, um einen Benchmark durchzuführen.

02 | 2021 33 So liefert ein Effektivitätstest eines unabhängigen Dritten nicht nur Informationen über die Effektivität des Systems bezüglich verschiedener Muster, sondern gibt auch einen Hinweis auf die Güte des Systems im Vergleich zu den bei anderen Instituten eingesetzten Algorithmen. Ein Benchmarking durch ein externes Beratungsunternehmen bei der VP Bank hat die überdurchschnittliche Effektivität des eingesetzten Modells bestätigt. Einsatz von historischen Transaktionen (Effizienz-Test) Ein entscheidender Schritt vor der Produktivnahme eines neuen Systems ist die Überprüfung der Effizienz mit historischen Transaktionen. Dieser Test erfolgt mit historischen Transaktionen der Bank. Nur durch den Einsatz echter Transaktionen lässt sich herausfinden, wie viele Treffer ein Algorithmus im täglichen Betrieb wirklich generiert und ob der dadurch entstehende Arbeitsaufwand in einem für die Compliance-Abteilung vertretbaren Rahmen ist. Zudem bietet der Effizienztest mit Echtdaten die Möglichkeit, das Trefferbild mit dem des alten Systems zu vergleichen. Insbesondere Treffer, die nur durch das alte System oder nur durch das neue System gefunden wurden bzw. werden, können auf weitere Optimierungsmöglichkeiten hinweisen oder diese sogar notwendig machen. Durch den Effizienztest mit Echtdaten möchte man Folgendes herausfinden: a. Wie hoch ist der Arbeitsaufwand im Vergleich zum alten System? b. Gibt es historische Treffer (True Positives), die durch das neue System nicht mehr gefunden werden (False Negatives)? c. Wie ist die Qualität der durch das neue System zusätzlich gefundenen Treffer? Erfüllt das System auf den historischen Daten nicht die Erwartungen, also generiert es zu viele Treffer von geringer Qualität, müssen die Lerndaten und Features weiter optimiert werden. Der finale Schritt vor dem Go-Live, um die Anzahl der False Positives gering zu halten Während bei der Überprüfung der Effektivität eines Algorithmus die Bedeutung eines True Positives klar definiert ist, muss bei der Überwachung der Effizienz berücksichtigt werden, dass ein Treffer zwar berechtigt, aber dennoch im laufenden Betrieb nicht erwünscht sein kann. Dieser Fall tritt immer dann auf, wenn der Kundenname oder der Name einer in den Transaktionen häufig auftauchenden Gegenpartei eine ausreichende Ähnlichkeit mit einem Namen auf der Prüfliste aufweist, es sich jedoch nicht um dieselbe Person handelt. Die Anzahl dieser unerwünschten Treffer steigt natürlicherweise mit der „Unschärfe” des Vergleichs und kann auch durch einen noch so intelligenten Algorithmus allein nicht vollständig abgestellt werden. Daher gilt es, diese unerwünschten Treffer schon vor der Produktivnahme zu identifizieren und das System zu kalibrieren. Dafür wird ein geeignetes White Listing eingerichtet, sodass die unerwünschten Treffer den manuellen Abklärungslauf nicht unnötig in die Höhe treiben. Die Schwierigkeit besteht hierbei darin, das White Listing so zu kalibrieren, dass zwar die Effizienz gesteigert, die Effektivität des Algorithmus jedoch nicht beeinträchtigt wird. Kalibrierung und Testing mit Tausenden von Zahlungen Das Team der VP Bank hat die Effizienz des Tools mit der neuen Prüflogik mittels Einspielung von täglich mehreren tausend Zahlungen auf Herz und Nieren geprüft. Durch gezielte dynamische Auswertungen konnte eruiert werden, welche Prüfelemente die meisten Treffer verursachen. Ein gezieltes White Listing, etwa durch die Erfassung von Ausnahmen gegen bestimmte Aliasse, führte zur Eliminierung zahlreicher unnötiger Treffer. Durch die sorgfältige Kalibrierung des Systems war bereits beim Go-Live das tägliche Treffervolumen trotz der unscharfen Suche auf leicht geringerem Niveau als beim Vorgängersystem.

die bank