Aufrufe
vor 4 Jahren

KINOTE 01.2019

  • Text
  • Methoden
  • Lernverfahren
  • Unternehmen
  • Systeme
  • Modell
  • Beispielsweise
  • Menschen
  • Einsatz
  • Banken
  • Intelligenz
Um einen Wandel der Finanzbranche erfolgreich zu meistern, müssen Kreditinstitute sowohl Chancen als auch Herausforderungen der Künstlichen Intelligenz (KI) erkennen. Unter der neuen Marke KINOTE der Bank-Verlag GmbH finden Sie Meldungen, Studien und Fachartikel zum Themenkomplex KI. Wir beantworten Ihre Fragen rund um KI. Wir berichten über Trends, neue Technologien, Forschungsergebnisse und daraus entstehende Möglichkeiten, die KI Ihrem Unternehmen bietet.

10 01 | 2019 05 |

10 01 | 2019 05 | Klassifikation per Entscheidungsbaum 06 | Klassifikation mittels Neuronalem Netz Geschlecht = Mann? Eingabeschicht Verdeckte Neuronen Ausgabeschicht Ja Nein Alter > 9,5? überlebt Gewicht Hund Katze ertrunken Angehörige an Bord > 2,5? Größe Maus ertrunken überlebt Quelle: Autor. Quelle: Autor. geeigneter Lernverfahren im Lauf viele Iterationen so angepasst werden, dass der Ausgabefehler des Gesamtnetzes minimal wird: Eingabe anlegen, Ist-Ausgabe des Netzes berechnen, Fehler als Differenz zur Soll-Ausgabe berechnen und dann die Verbindungsgewichte anteilig modifizieren. Künstliche Neuronale Netze sind allerdings Black-Box-Modelle. Die durch die Verbindungsgewichte kodierten Modelle lassen sich nicht ohne weiteres interpretieren. » 6 Die zweite große Gruppe von Verfahren aus dem Bereich des überwachten Lernens sind neben Klassifikationsverfahren die Regressionsverfahren. Sie sagen kontinuierliche Ausgaben voraus, beispielsweise Temperaturänderungen oder Kursentwicklungen. Eines der bekanntesten Verfahren ist die lineare Regression, die die Parameter eines vorgegebenen Modells – in diesem Fall die einer Geraden – so anpasst, dass die Gerade mit minimalem Gesamtfehler durch die Punktwolke der Testpunkte verläuft. Ist das Modell gelernt, kann für unbekannte neue Eingangswerte der vermutliche Ausgangswert prognostiziert werden. » 7 am häufigsten genutzten unüberwachten Lernverfahren ist das Clustering. Clustering ermöglicht eine explorative Datenanalyse, um versteckte Muster oder Häufungen in den Daten zu entdecken. Häufig wird hierfür der k-Means-Algorithmus verwendet. Mittels eines iterativen Verfahrens werden die Testpunkte nach und nach der vorgegebenen Anzahl von k-Zentren zugeordnet, in der Weise, dass die Summe der quadrierten Abweichungen von den Cluster-Zentren minimal ist. » 8 07 | Lineare Regression Unüberwachtes Lernen Unüberwachte Lernverfahren finden versteckte Muster oder intrinsische Strukturen in Daten. Sie werden genutzt, um Schlussfolgerungen aus Datensätzen zu ziehen, die nur aus Eingangsdaten ohne zugehörige Ausgangsdaten bestehen. Eines der Quelle: Autor.

01 | 2019 11 Wann sollte maschinelles Lernen genutzt werden? Als grobe Empfehlung sollte Maschinelles Lernen dann in Betracht gezogen werden, wenn die Aufgabe komplex ist, das Problem ein großes Datenvolumen und viele Variablen umfasst, aber keine explizite Formel bekannt ist. Maschinelles Lernen könnte beispielsweise eine gute Option in folgenden Situationen sein: ■■ handgeschriebene Regeln und Gleichungen werden zu komplex (z. B. Gesichtserkennung), ■■ die Regeln ändern sich kontinuierlich (z. B. Fraud Detection), ■■ die Natur der Daten ist variabel, und das Programm muss sich anpassen (z. B. Vorhersage von Einkaufstrends). Herausforderungen Der Umgang mit den Daten und das Finden eines geeigneten Modells erfordert einige Erfahrung. Eine Herausforderung ist die Heterogenität der Daten, die in allen Formen und Größen vorkommen. Real-World-Datensätze können chaotisch, verrauscht, unvollständig und in einer Vielzahl von Formaten daherkommen. Gelegentlich müssen mehrere verschiedene Datentypen, wie maschinengenerierte Datenströme, Texte oder Bilder, kombiniert werden. Zudem erfordert die Datenvorverarbeitung möglicherweise spezielle Kenntnisse und Werkzeuge. Beispielsweise setzt die Auswahl von Eigenschaften zum Trainieren einer Objekterkennung spezielle Kenntnisse aus der Bildverarbeitung voraus. Generell erfordern unterschiedliche Datentypen unterschiedliche Herangehensweisen in der Vorverarbeitung. 08 | Clustering mittels k-Means-Algorithmus Quelle: Autor. + + + + + + ++ + + + + + o + + + + + + + + + x + + + + o x + + + + o o + o + o x x x oo o o o x + + o x x o o x x x x o o o x xxx x x o o x x x x x x x x x o o x o x o o o x x xx x x x x x x x x x x x x x x x x x x x x x x x xx x x x x x x x Nicht zuletzt braucht es einfach Zeit, um das beste Modell für die Daten zu finden. Das richtige Modell auszuwählen, ist ein Balanceakt. Hochflexible Modelle neigen zur Überanpassung von Daten durch die Modellierung auch geringfügigster Variationen, die schlicht Rauschen sein könnten (Overfitting). Andererseits können sehr einfache Modelle unberechtigte Annahmen beinhalten (Overgeneralization). Generell gilt, dass immer Kompromisse zwischen Modellgeschwindigkeit, Genauigkeit und Komplexität eingegangen werden müssen. Fazit Maschinelles Lernen ermöglicht das automatisierte Entdecken bisher unbekannter Zusammenhänge und Muster in Daten. Dazu werden aus Daten Informationen gewonnen und diese weiter zu Wissen veredelt. Umfangreiche Mengen an Rohdaten kondensieren so zu kompaktem, operativem Wissen. Im Kern geht es beim maschinellen Lernen also um Wissensgewinnung und die verschiedenen Aufgaben, die daraus erwachsen. Werden beispielsweise die Zustände eines Prozesses über einen längeren Zeitraum erfasst, können die gewonnenen Muster genutzt werden, um den Prozess zu optimieren und Wettbewerbsvorteile zu erzielen. Da die Methoden des maschinellen Lernens per se generisch sind, ist ihre Anwendung in einem sehr weiten Kontext möglich – vorausgesetzt eine entsprechende Datenbasis liegt bereits vor oder kann erfasst werden. Autor Prof. Dr. Stefan Berlik ist Studiengangsleiter Digitale Technologien an der Fachhochschule Bielefeld am Campus Gütersloh und vertritt das Lehrgebiet Big Data Analytics.

die bank