ML-Modell trainieren

Objective

After completing this lesson, you will be able to training eines ML-Modells basierend auf Kundendaten anstoßen

Modelltraining in SAP AI Core

Schritte für das Modelltraining: Daten-Upload in z.B. S3, Trainings-Argo-Workflow absenden, auf resultierendes Modellartefakt zugreifen

Notiz

Sie können mehrere Datensets für das Training hinzufügen. Der Wechsel zwischen Trainingsdatensets kann mithilfe von Vorlagenparametern erreicht werden.

Um ein Modell zu trainieren, muss ein Datenset bereitgestellt und SAP AI Core zur Verfügung gestellt werden. Sie können dies erreichen, indem Sie die Datensets in einem Hyperscaler-Objektspeicher speichern und die erforderlichen Zugriffsrechte für SAP AI Core bereitstellen.

Hinweis

Ein Hyperscaler-Objektspeicher stellt die kosteneffektivste, robusteste und dauerhafteste Art der Verwaltung von Datensets und Modellen dar, da er sich durch die Fähigkeit auszeichnet, unter einem kontrollierten und effizient verwalteten softwaredefinierten Framework massiv zu expandieren. Da SAP AI Core außerdem für die Arbeit mit Containern konzipiert ist, ermöglicht ein Objektspeicher Argo einen transparenten, automatischen Datenzugriff, indem er Daten in/aus Pipeline-Containern kopiert und einen sicheren Credential-Speicher sicherstellt.

Schritt 1

Im Modelltrainingblock verbindet einen Objektspeicher mit SAP AI Core und lädt das Trainingsdatenset.

Schritt 1 trennt auch die KI-Artefakte, was durch den Ausgleich der Erstellung von SAP-AI-Core-Instanzen und Ressourcengruppen erreicht wird. Natürlich können verschiedene Tenants verschiedene KI-Artefakte isolieren, es ist jedoch auch möglich, Namensräume zu definieren, um zugehörige Ressourcen im Umfang eines SAP-AI-Core-Tenants zu gruppieren und zu trennen.Tenant-Trennung in SAP AI Core über „Ressourcengruppen“. Auf Assets wie Data, Training und Serving Templates können andere Tenants nicht zugreifen.

AI Core: Eingabe-Dataset registrieren

Ein Beispiel für ein Asset, das innerhalb einer Ressourcengruppe getrennt werden kann, ist das Eingabedatenset, das zum Trainieren eines ML-Modells verwendet wird. Die Registrierung eines Datensets in SAP AI Core setzt das Anlegen einer Ressourcengruppe voraus. Diese Ressourcengruppe ist nur für Personen sichtbar, die auf diese bestimmte Ressourcengruppe zugreifen dürfen, und wird von allen Komponenten verbraucht, die zu derselben Ressourcengruppe gehören.

Notiz

Obwohl die Trennung von Anlagen mithilfe von Ressourcengruppen gültig ist, ist es wichtig, verschiedene Datensets bereitzustellen, die in verschiedenen Läufen in dieselbe Trainingspipeline eingefügt werden, was jedoch zu unterschiedlichen Modellen führt.

Dies kann periodisch erfolgen oder indem ein großes Datenset in verschiedene Varianten gemischt wird, um das beste generalisierende Modell zu erhalten.

AI Core: Konfiguration anlegen

Wie bereits erwähnt, können Sie SAP AI Core verwenden, um eine eigene Trainingspipeline zu entwerfen und sie in einer Trainingsvorlage anzugeben, die zum Definieren eines ausführbaren Objekts in SAP AI Core verwendet wird. Der Einfachheit halber gehört es zu einem bestimmten Szenario, das als zusätzlicher Namensraum fungiert und alle ausführbaren Einheiten gruppiert, die Sie benötigen, um Ihre spezifischen geschäftlichen Herausforderungen zu lösen. Die ausführbaren Einheiten sind zusammen mit dem Eingabedatenset die Schlüsselkomponenten, die Sie miteinander verbinden müssen, um eine Trainingskonfiguration anzulegen und dann ein ML-Modell in SAP AI Core zu trainieren.

Notiz

Der Einfachheit halber fällt es unter den Schirm eines bestimmten „Szenarios", das als zusätzlicher Namensraum fungiert.

Leider ist das Szenario kein Namensraum. Sie wird zum Gruppieren von Positionen eines bestimmten ML-"Projekts" verwendet.

Eine Konfiguration ist eine Reihe von Parametern, die für jeden Lauf geändert werden können.

AI Core: Workflow-Ausführung auslösen

Eine ausführbare Einheit enthält Informationen über den Trainings-Input und -Output, die zu verwendenden Pipeline-Container und die erforderlichen Infrastrukturressourcen. SAP AI Core stellt mehrere vorkonfigurierte Infrastrukturbündel bereit, die Ressourcenpläne genannt werden und sich je nach Anzahl der CPUs, GPUs und Speichermenge voneinander unterscheiden. Daher kann SAP AI Core mit anspruchsvollen Workloads effizient umgehen.

Ein weiterer wichtiger Punkt bei der Arbeit mit ML ist die Bewertung der Genauigkeit des Modells. ML-Modelle werden für praktische Geschäftsentscheidungen verwendet, sodass genauere Modelle zu besseren Entscheidungen führen können. Die Kosten für Fehler können enorm sein, aber die Auswirkungen dieser Fehler können durch Optimierung der Genauigkeit des Modells gemindert werden. Ein Kunde, der SAP AI Core einsetzt, fragt sich vielleicht: Wie werde ich die Performance meines Modells bewerten? Die Antwort ist, dass SAP AI Core mehrere APIs bereitstellt, um Ihre bevorzugten Metriken zu registrieren, die abgerufen und geprüft werden können, sobald das Training abgeschlossen ist.

AI-Launchpad: Ausführungsstatus und Protokolle prüfen

Wenn das Modell ein Training abgeschlossen hat und zufriedenstellende Metriken aufweist, besteht der letzte Schritt des Modelltrainingsblocks darin, die Ergebnisse zu sammeln. Wenn das Modell von SAP AI Core im selben verbundenen Hyperscaler-Objektspeicher produziert und gespeichert wird, wird es automatisch in SAP AI Core registriert und ist bereit für die Implementierung.

Live-Daten mit SAP AI Core in Ihren eigenen Preisprädiktor aufnehmen

Datenpipelines erstellen und Code wiederverwenden, um Modelle für verschiedene Datensets zu trainieren und zu generieren.