26 01 | 2021 der erfolgreichen Übertragung des fertigen Modells in eine Produktionsumgebung (Deployment), was suggeriert, dass die Arbeit mit der initialen LiveStellung des Modells abgeschlossen ist. Tatsächlich sind für einen nachhaltigen Beitrag eines Modells zur Wertschöpfung des Unternehmens ein kontinuierliches Überwachen der ModellPerformance und fortlaufende Optimierungen erforderlich. Gerade in einem dynamischen, sich stark verändernden Bankenumfeld ist es von zentraler Bedeutung, dass die genutzten Modelle regelmäßig auf Basis der aktuellsten Daten neu trainiert werden, um somit das Optimum aus den eigenen Daten herauszuholen. So ist etwa bei Modellen zur Selektion von Zielgruppen für Direktmarketing Kampagnen keinesfalls garantiert, dass besonders affine Kunden für ein Produkt noch die gleichen Charakteristiken haben wie vor einigen Monaten, als das Modell entwickelt wurde. Veränderte Konditionen bei den eigenen Produkten oder bei Wettbewerbern (z. B. die Einführung von Kontoführungsgebühren), ein dynamisches ökonomisches Umfeld sowie sich generell verändernde Kundengewohnheiten erfordern regelmäßige Neuentwicklungen bereits produktiv eingesetzter Modelle, um mögliche Veränderungen von Zielgruppen adäquat zu berücksichtigen. AutoML leistet durch die deutliche Beschleunigung des Entwicklungsprozesses hierbei einen zentralen Beitrag, um mit knappen Ressourcen überhaupt erst diesen Anforderungen effizient begegnen zu können. Sogar ein vollautomatisierter Austausch des alten Produktivmodells mit dem neu entwickelten Modell ist grundsätzlich umsetzbar. Kommerzielle Tools vs. Open-Source-Lösungen AutoML ist aktuell eines der Trendthemen aus dem Bereich Data Science. Mehrere kommerzielle Anbieter haben in den vergangenen Jahren ihre AutoMLLösungen auf den Markt gebracht und permanent weiterentwickelt. Neben Startups bieten mittlerweile auch praktisch alle großen CloudAnbieter ihre eigenen AutoMLLösungen an. Darüber hinaus gibt es aber auch zahlreiche OpenSourcePakete, mit denen die verschiedenen Teilbereiche der Modellentwicklung automatisiert werden können und die für die Entwicklung eigener AutoMLPipelines als Grundlage verwendet werden können. Die Antwort auf die Frage, ob kommerzielle oder OpenSourcebasierte Lösungen bevorzugt werden sollten, lässt sich nicht pauschal beantworten. Verschiedene Faktoren wie die Anzahl und Expertise der vorhandenen Data Scientisten im Unternehmen sowie die Verfügbarkeit von Plattformen, auf denen die Entwicklung von MachineLearningModellen bereits möglich ist, könnten aber die Entscheidung zugunsten einer internen Lösung auf Basis von OpenSourcePaketen beeinflussen. Eigenentwickelte AutoMLPipelines dürften zwar grundsätzlich ein weniger breites Spektrum verschiedener Anwendungsgebiete abdecken als kommerzielle Lösungen, ermöglichen dabei jedoch spezifischere Anpassungen an die eigenen Anforderungen. Wenn etwa die Entwicklung von Klassifikationsmodellen im Fokus steht, kann der Entwicklungsprozess für diese Art der Problemstellung durch eine maßgeschneiderte AutoMLPipeline erheblich beschleunigt und der automatisierte Prozess auf die eigenen Bedürfnisse zugeschnitten werden. So kann beispielsweise die Optimierung der Modell Parameter anhand benutzerdefinierter PerformanceMetriken erfolgen oder andere Algorithmen und Funktionalitäten in die automatisierte Entwicklung eingebaut werden, die kommerzielle Tools nicht in dem benötigten Umfang bieten. Besitzt ein Unternehmen jedoch nicht die erforderlichen personellen und infrastrukturellen Voraussetzungen, können kommerzielle AutoMLLösungen, die in der Cloud oder On Premise betrieben werden können, attraktive Alternativen sein. Dabei bestechen vor allem Cloudbasierte Angebote durch ihre große Flexibilität hinsichtlich der buchbaren Rechenkapazitäten und der nutzungsabhängigen Bepreisung. Allerdings existieren besonders im stark regulierten Bankenumfeld verschiedene Fragen rund um die Themen Regulatorik und Datensicherheit in der Cloud, wie z. B. die Standorte der Server. Die Beantwortung dieser Fragen stellt für viele Banken aktuell noch eine größere Hürde für die Nutzung von CloudLösungen dar. Autor Benjamin Stahl ist Data Scientist bei der ING DiBa AG in Frankfurt und beschäftigt sich dort u. a. mit der Automatisierung von Machine Learning sowie Verfahren zur Erklärbarkeit von KI für Anwendungen im Direktmarketing.
01 | 2021 27 Fazit AutoML hat das Potenzial, den aufwendigen Prozess, der typischerweise für die Entwicklung von Machine- Learning-Modellen notwendig ist, deutlich zu beschleunigen. Durch die Automatisierung zentraler und sehr zeitintensiver Schritte der Modellierung, ermöglicht es AutoML auch Mitarbeitern ohne Spezialkenntnisse komplexe Modelle auf Basis der neuesten Verfahren und Algorithmen zu entwickeln sowie produktiv zu verwenden. Data Scientisten werden dabei keinesfalls überflüssig, da eine vollständige Automatisierung des Entwicklungsprozesses nicht möglich ist. Ihr fachlicher Input wird auch weiterhin zur Problemdefinition, dem Entwurf des Lösungsansatzes oder der Datenaufbereitung benötigt. Darüber hinaus können auch erfahrene Teams aus Data Scientisten von der Automatisierung profitieren, da sie repetitive Aufgaben vermeiden und ihren Fokus stärker auf andere wichtige Teilbereiche der Modellentwicklung legen können. Gleichzeitig können sie durch die Weiterentwicklung von zentralen Komponenten einer inhouse entwickelten AutoML-Pipeline die genutzten Methoden für die internen Anwendungsfälle optimieren. Durch diesen Ansatz lassen sich der Modell - Output eines Teams und oftmals auch die Qualität der einzelnen Modelle deutlich steigern, wodurch AutoML ein wesentlicher Faktor für die Umsetzung einer Modellfabrik im Unternehmen ist.
Laden...
Laden...
Laden...