Aufrufe
vor 4 Jahren

KINOTE 01.2019

  • Text
  • Methoden
  • Lernverfahren
  • Unternehmen
  • Systeme
  • Modell
  • Beispielsweise
  • Menschen
  • Einsatz
  • Banken
  • Intelligenz
Um einen Wandel der Finanzbranche erfolgreich zu meistern, müssen Kreditinstitute sowohl Chancen als auch Herausforderungen der Künstlichen Intelligenz (KI) erkennen. Unter der neuen Marke KINOTE der Bank-Verlag GmbH finden Sie Meldungen, Studien und Fachartikel zum Themenkomplex KI. Wir beantworten Ihre Fragen rund um KI. Wir berichten über Trends, neue Technologien, Forschungsergebnisse und daraus entstehende Möglichkeiten, die KI Ihrem Unternehmen bietet.

8 01 | 2019 02 | Arten

8 01 | 2019 02 | Arten maschineller Lernverfahren Maschinelles Lernen Überwachtes Lernen Entwickle prädiktive Modelle auf Basis der Ein- und Ausgabedaten Unüberwachtes Lernen Gruppiere und interpretiere Daten nur auf Basis der Eingabedaten Bestärkendes Lernen Plane Handlungsketten auf Basis qualitativen Feedbacks Klassifikation Regression Clustering Reinforcement Learning Quelle: Autor. Lernarten beim maschinellen Lernen Das maschinelle Lernen ist ein Teilgebiet der Künstlichen Intelligenz und beschäftigt sich mit der Frage, wie Computersystemen eine Fähigkeit verliehen werden kann, die Menschen und Tieren auf natürliche Weise gegeben ist: aus Erfahrungen zu lernen. Algorithmen des maschinellen Lernens beherrschen diese Kunst durch den Einsatz geeigneter statistischer Methoden. Sie können dann ebenfalls modellfrei direkt aus Daten „lernen“, also ohne – wie klassische Programme – an eine vorgegebene Gleichung als Modellrahmen für das zu modellierende Wissen gebunden zu sein. Das garantiert nicht nur maximale Flexibilität, sondern erlaubt es ihnen außerdem, ihre Leistungsfähigkeit sukzessive mit der Anzahl der zur Verfügung stehenden Datensätze zu verbessern. Die Einsatzmöglichkeiten der Methoden des maschinellen Lernens sind vielfältig. Häufig kommen sie beim Data Mining zum Einsatz. Mit dem Aufkommen von Big Data wurden Algorithmen des maschinellen Lernens u. a. erfolgreich im Gebiet Computational Finance zum Credit Scoring und automatischen Handel eingesetzt. Im Bereich der Bildverarbeitung und Computer Vision nutzt man sie zur Gesichts-, Bewegungs- und Objekterkennung, in der Computational Biology zur Tumorerkennung, DNA-Sequenzierung und dem Wirkstoffdesign, in der Energieproduktion zur Preis- und Lastvorhersage, im Automobilbau, der Luftfahrt und dem produzierendem Gewerbe für Predictive Maintenance oder auch zum Natural Language Processing. So vielfältig die Anwendungen im Einzelnen auch sind, im Kern basieren die Methoden des maschinellen Lernens auf nur drei Lernarten: überwachtem Lernen, unüberwachtem Lernen und bestärkendem Lernen. » 2 Beim überwachten Lernen erhält der Lernende bzw. der Algorithmus neben der jeweiligen Aufgabe zur Kontrolle auch die richtige (d. h. gewünschte) Lösung und damit die Möglichkeit, potenzielle Fehlleistungen quantitativ zu beurteilen und sein Modell geeignet zu adaptieren. Überwachte Lernverfahren ermöglichen es, Daten zu kategorisieren oder generalisieren. Zu ihren typischen Vertretern zählen die Klassifikation und die Regression. Unüberwachte Lernverfahren hingegen arbeiten auf Basis nur der Eingabedaten, ohne die Soll-Ausgabe. Sie ermöglichen es, in einer Menge von Daten Häufungen oder Ausreißer zu entdecken. Ein prominenter Vertreter unüberwachter Lernverfahren ist das Clustering. Eine dritte Lernart, die hier jedoch nicht weiter betrachtet werden wird, ist das bestärkende Lernen. Durch das Geben qualifizierter Feedbacks am Ende von Aktionsketten ermöglicht es das Lernen komplexer Handlungsstrategien und Politiken. Überwachtes Lernen Ziel überwachter Lernverfahren ist die Entwicklung eines Modells, das basierend auf Evidenz Vorhersagen unter Unsicherheit erlaubt. Dazu wird eine gegebene Menge von Eingangsdaten nebst der zugehörigen gewünschten Reaktionen auf diese Daten (Soll-Ausgaben) genutzt, um ein Modell zu trainieren. Das trainierte Modell erlaubt es dann, sinnvolle Vorhersagen für das Ausgabeverhalten bei neuen Eingaben zu generieren. Das Beispiel in der Abbildung » 3 verdeutlicht dieses Konzept. Gegeben sei eine Menge an Trainingsdaten, die sowohl Eingangsdaten umfasst (Koordinaten der Punkte) als auch die gewünschten Soll-Ausgaben (Zuordnung zu den Klassen A bzw. B). Aus diesen Informationen wird ein Modell in Form einer

01 | 2019 9 03 | Modellbildung bei überwachten Lernverfahren + + + + + + - + - - - - - Klasse A + + + + + + - + - - - - - Klasse B + Klasse A + + + + + + + + - - + - - - - - - Klasse B Trainingsdaten Modell Vorhersage Quelle: Autor. einfachen Separationsgeraden abgeleitet, die einerseits die bekannten Daten gut beschreibt, anhand derer aber auch neue Punkte zuverlässig klassifiziert werden können. Das vorgestellte Beispiel zählt zur Klasse der Klassifikationsverfahren. Generell sagen Klassifikationsverfahren diskrete Ausgaben voraus, etwa ob eine E-Mail Spam ist oder nicht oder ob ein eingescannter Buchstabe ein ‚A‘ ist. Klassifikationsmodelle klassifizieren Eingangsdaten in Kategorien. Drei gängige Klassifikationsverfahren sollen im Folgenden kurz vorgestellt werden. Das einfachste denkbare Verfahren ist die Nächste-Nachbarn-Klassifikation. Die Zugehörigkeit zu einer Klasse wird einfach anhand der Klassenzugehörigkeiten der nächsten Nachbarn entschieden. Das Verfahren ist nicht besonders effizient, 04 | Nächste-Nachbarn-Klassifikation Hund Hund Katze Katze Katze X ? Maus Maus Maus Quelle: Autor. aber robust. Gegeben seien beispielsweise einige bekannte Tiere, die anhand ihrer Größe und ihres Gewichts in eine Karte eingetragen wurden. Um welche Art es sich bei einem unbekannten Tier handelt, wird dann anhand der Arten der am nächsten benachbarten Tiere entschieden. » 4 Einen anderen Ansatz verfolgen Entscheidungsbäume. Die Trainingsdaten werden hier in einer baumartigen Struktur gemäß der Ausprägung ihrer Attribute separiert. In jedem Knoten wird nach dem Attribut getrennt, das von allen zur Verfügung stehenden Attributen die reinste Separation erlaubt, d. h. möglichst sortenrein getrennte Kinderknoten erzielt. Entscheidungsbäume sind White-Box-Modelle. Der durch sie kodierte Entscheidungsprozess kann nachvollzogen und interpretiert werden. Die Passagierliste der Titanic kann beispielsweise genutzt werden, um ein Modell zu lernen, das auf Basis der Attribute der Passagiere Auskunft über ihre Überlebenswahrscheinlichkeit gibt. » 5 Anders stellt sich die Situation bei einem weiteren sehr verbreiteten Klassifikationsverfahren dar, den Künstlichen neuronalen Netzen. In Anlehnung an Netze aus natürlichen Neuronen stehen hier künstliche Neuronen zur Verfügung, deren Verbindungsgewichte adaptiert werden können. Jedes einzelne Neuron stellt einen einfachen Schwellwertschalter dar, dessen Ausgang in Abhängigkeit der Aktivierung am Eingang feuert oder auch nicht. Ein einzelnes Neuron erlaubt es damit, eine wie in der Abbildung » 3 gezeigte Separationsgerade zu modellieren. Prinzipiell kann mit Künstlichen neuronalen Netzen sogar jede beliebige Funktion beliebig genau approximiert werden, indem die Separationsgeraden von einer Vielzahl von Neuronen aus ggf. mehreren Schichten überlagert werden. Zur Adaption der Separationsgeraden müssen die Gewichte mittels

die bank