Aufrufe
vor 1 Jahr

die bank 05 // 2022

  • Text
  • Banken
  • Unternehmen
  • Risiken
  • Swift
  • Cips
  • Anbieter
  • Digitalisierung
  • Regulierung
  • Karriere
  • Digitale
  • Wwwbankverlagde
die bank gehört zu den bedeutendsten Publikationen der gesamten Kreditwirtschaft. Die Autoren sind ausnahmslos Experten von hohem Rang. Das Themenspektrum ist weit gefächert und umfasst fachlich fundierte Informationen. Seit 1961 ist die bank die meinungsbildende Fachzeitschrift für Entscheider in privaten Banken, Sparkassen und kreditgenossenschaftlichen Instituten. Mit Themen aus den Bereichen Bankmanagement, Regulatorik, Risikomanagement, Compliance, Zahlungsverkehr, Bankorganisation & Prozessoptimierung und Digitalisierung & Finanzinnovationen vermittelt die bank ihren Lesern Strategien, Technologien, Trends und Managementideen der gesamten Kreditwirtschaft.

DIGITALISIERUNG BLICK

DIGITALISIERUNG BLICK AUF IAAS, PAAS UND SAAS DATA SCIENCE IN DER CLOUD Die Cloud eröffnet vielfältige neue Möglichkeiten und bietet gerade für den Bereich Data Science erhebliche Vorteile. In diesem Beitrag werden die Funktionsweise und Nutzung der Cloud in Hinblick auf Data Science erläutert. Zudem gibt es Hinweise darauf, welche Aspekte bei einer Data-Science-Strategie für die Cloud beachtet werden sollten. Die Autoren sagen: „Wer einmal Data Science in der Cloud betrieben hat, will diese nicht mehr missen.“ Doch gelte es sorgfältig abzuwägen, wo und wie stark man sich an Cloud-Anbieter binden will. 32 05 | 2022

DIGITALISIERUNG Das Thema Cloud ist mit gutem Grund aktuell eins der am meist diskutierten Themen in der Informationstechnologie. Durch die dynamische Nutzung von Cloud-Diensten können Produkte schneller an den Start gebracht, innovative Services entwickelt, Skalierbarkeit ermöglicht und nicht zuletzt in vielen Fällen auch Kosten gespart werden. Die durch die Cloud-Services angebotene enorme Flexibilität ist, gerade vor dem Hintergrund von agilen Arbeitsmethoden, von entscheidender Bedeutung für die digitale Transformation der Finanzindustrie, die unerlässlich für die Zukunftsfähigkeit der Institute ist. Die Nutzung der Cloud umfasst grundsätzlich drei Säulen bzw. Service-Modelle: Infrastructure as a Service (IaaS), Platform as a Service (PaaS) und Software as a Service (SaaS). Die großen Cloudanbieter – zu nennen sind dabei insbesondere die Amazon Web Services (AWS), Microsoft und Google – decken mit ihren Angeboten all diese drei Säulen ab. Wesentliche Charakteristika von IaaS, PaaS und SaaS sind in der Tabelle ÿ 1 dargestellt. Data Science benötigt starke Leistungsspitzen, die per IaaS ideal bedient werden Gerade das Thema IaaS spielt beim Einsatz von Data Science eine wichtige Rolle. Während in einem klassischen Rechenzentrum Hardware teuer und mit langen Vorlaufzeiten erworben werden muss, stehen Cloud- Ressourcen per IaaS im Regelfall innerhalb weniger Minuten zur Verfügung, ob einzelne Rechner oder ganze Rechencluster. Das gilt auch andersherum: Nicht wenige Firmen stehen heute vor den Investitionsruinen überdimensionierter Rechenzentren und veralteter Hardware. Ganz anders in der Cloud: Sobald Rechenkapazität nicht mehr benötigt wird, kann diese ebenfalls in Minuten wieder an den Cloud-Anbieter zurückgegeben werden und muss nicht mehr bezahlt werden. Cloud bietet also sozusagen vollständig flexibles Hardware-Leasing auf Minutenbasis – die Schlüsselwörter sind „on demand“ und „pay per use“. Dieser Aspekt der dynamischen Bereitstellung von Hardware im Rahmen von IaaS ist insbesondere für Data Science von hoher Bedeutung. Das liegt in der spezifischen Art begründet, wie Data-Science-Produkte entwickelt werden. Hier geht es darum, sehr große Datenmengen zu verarbeiten, zu verdichten und Muster zu erkennen oder leistungsfähige Modelle der Künstlichen Intelligenz (KI) zu trainieren. Gerade das Training von KI-Modellen benötigt in vielen Fällen enorme Rechenkapazität und spezialisierte Hardware. Wenn die Verarbeitung oder das Training abgeschlossen sind, werden die Daten ausgewertet oder die Modelle erprobt oder in Produktion gebracht. In dieser Phase ist die benötigte Rechenkapazität um Größenordnungen geringer. Im Effekt benötigt Data Science also Lastspitzen, wie sie sonst in kaum einem anderen Bereich der IT vorkommen. Es ist nicht untypisch, dass z. B. das Training einmal im Monat auf einem spezialisierten Rechner oder Cluster mit vielen speziellen Rechenwerken (sogenannten Graphics Processing Units, GPU) vorgenommen wird, die Anwendung der Modelle dann aber auf viel 05 | 2022 33

die bank