Zum Hauptinhalt springen

Was sind MLOps?

Machine Learning Operations (MLOps) sind eine Praxis für die Zusammenarbeit und Kommunikation zwischen Datenwissenschaftler:innen und Betriebsexpert:innen, um die Lebenszyklen von Machine Learning (ML) in der Produktion zu verwalten. Dabei werden die Grundsätze von DevOps in den ML-Lebenszyklus einbezogen, um den Prozess von der Modellentwicklung bis zur Bereitstellung und Überwachung zu rationalisieren und zu automatisieren. Ziel von MLOps ist es, ML-Modelle auf strukturierte und effiziente Art und Weise schneller bereitzustellen und zu skalieren.
 

                                  

                                         1 - Source: Microsoft

Die fünf Stufen der MLOps-Reife

Microsoft geht davon aus, dass es fünf Stufen der MLOps-Reife gibt, die von keinen MLOps bis zu vollständig automatisierten Prozessen reichen. Dies ist nur eine kurze Zusammenfassung, die Dir dabei helfen soll, Deinen aktuellen Reifegrad zu ermitteln. Weitere Details findest Du unter diesem Link.

Level 0: Keine MLOps

  • Herausforderungen: 
    Die Verwaltung des gesamten Lebenszyklus von Modellen für maschinelles Lernen ist schwierig. Die Teams arbeiten in Silos, und die Freigaben sind mühsam.
     
  • Eigenschaften:
    • Manuelles Training der Modelle.
    • Keine zentralisierte Verfolgung der Modellleistung.
    • Manuelle Entwicklung, Bereitstellung und Prüfung.
    • Die meisten Systeme existieren als „Black Boxes“.

Level 1: DevOps, aber kein MLOps

  • Herausforderungen: 
    Obwohl die Freigaben weniger schmerzhaft sind als auf Level 0, sind die Unternehmen immer noch auf das Datenteam für jedes neue Modell angewiesen.
     
  • Eigenschaften:
    • Automatisierte Aufbau- und Testverfahren für den Anwendungscode.
    • Begrenzte Rückmeldungen zur Modellleistung in der Produktion.

Level 2: Automatisiertes Training

  • Eigenschaften:
    • Zentrale Verfolgung der Leistungsfähigkeit der Modellschulung.
    • Automatisierte Modellschulung.
    • Einfache Nachvollziehbarkeit der Modelle.
    • Vollständig verwaltete und nachvollziehbare Trainingsumgebung.

Level 3: Automatisierte Bereitstellung von Modellen

  • Eigenschaften:
    • Automatisierte Tests für den gesamten Code.
    • Integrierte A/B-Tests der Modellleistung.
    • Vollständige Rückverfolgbarkeit von der Bereitstellung bis zu den ursprünglichen Daten.
    • Reibungslose, automatische Freigaben.

Level 4: Vollständig automatisierte MLOps-Operationen

  • Eigenschaften:
    • Automatisierte Modellschulung und -prüfung.
    • Annäherung an ein System ohne Ausfallzeiten.
    • Produktionssysteme liefern Erkenntnisse für kontinuierliche Verbesserungen.
    • Vollständig automatisiertes und leicht zu überwachendes System.

Warum aufsteigen?

Ein höherer MLOps-Reifegrad hat mehrere Vorteile. Er verbessert die Effizienz, verringert das Risiko, erhöht die Modellqualität und verschafft einen Wettbewerbsvorteil. Lass uns näher auf die Gründe eingehen, warum Du einen höheren Reifegrad anstreben solltest:

  • Effizienz und Produktivität: Je weiter Dein Unternehmen voranschreitet, desto mehr wirst Du Prozesse rationalisieren, sich wiederholende Aufgaben automatisieren und manuelle Eingriffe reduzieren. Folglich führen automatisiertes Modelltraining, Bereitstellung und Überwachung zu schnelleren Entwicklungszyklen und kürzeren Markteinführungszeiten für Deine Produkte. Sieh Dir an, wie Perplexity AI mit Hilfe von Azure AI Studio die Zeit bis zur Markteinführung verkürzt hat.
     
  • Risikominimierung: Höhere Reifegrade sorgen für eine bessere Governance und ein besseres Risikomanagement. Nachvollziehbarkeit, Versionskontrolle und automatisierte Tests minimieren das Risiko von Fehlern oder unerwartetem Verhalten in der Produktion.
     
  • Skalierbarkeit und Agilität: Ausgereifte MLOps-Verfahren ermöglichen es Unternehmen, ihre Initiativen zum maschinellen Lernen zu skalieren. Automatisierte Prozesse ermöglichen es den Teams, mehrere Modelle und Projekte gleichzeitig zu bearbeiten. Sieh Dir an, wie Delivery Hero seine Modelle in über 70 Ländern mit unterschiedlichen Vorschriften mit MLOps in Google Cloud ausführen kann.
     
  • Qualitätssicherung: Strenge Tests, A/B-Experimente und kontinuierliche Überwachung in höheren Reifegraden verbessern die Modellqualität. Unternehmen können ihre Modelle mit minimalem Risiko einer Leistungsverschlechterung zuverlässig bereitstellen.
     
  • Optimierung der Kosten: Die Automatisierung senkt die Betriebskosten durch Minimierung des manuellen Aufwands. Effiziente Ressourcennutzung und optimierte Infrastruktur tragen zu Kosteneinsparungen bei.
     
  • Wettbewerbsvorteil: Unternehmen mit ausgereiften MLOps-Verfahren können schneller modernisieren, auf Marktveränderungen reagieren und sich einen Wettbewerbsvorteil verschaffen. Zuverlässige, qualitativ hochwertige Modelle erhöhen die Kundenzufriedenheit und das Vertrauen.

Wie kannst Du aufsteigen?

Nachdem wir verschiedene unserer Kunden bei ihrer MLOps-Journey unterstützt haben, haben wir festgestellt, dass der wichtigste Aspekt darin besteht, dass es keinen „besten“ MLOps-Ansatz gibt und dass das optimale MLOps-Design von Unternehmen zu Unternehmen unterschiedlich ist.

Wenn Du Deine Arbeitsabläufe verbessern und mit MLOps reifer werden willst, beginne damit, Deine wichtigsten Engpässe zu identifizieren und herauszufinden, wie sie sich auf die KI-Vision Deines Unternehmens auswirken. 

Nach der Klärung Deiner individuellen Bedürfnisse empfehlen wir Dir, zunächst ein Konzept zu entwickeln, das auf den Anforderungen Deines Unternehmens basiert, und erst danach die richtigen Werkzeuge für die Aufgaben auszuwählen. Das bedeutet auch, dass Du vielleicht nicht gleich aufs Ganze gehen musst, sondern dass es immer davon abhängt, wie stark Dein Unternehmen auf die Verfügbarkeit und Gültigkeit von Modellen angewiesen ist.Das hilft Dir dabei, Dich auf das große Ganze zu fokussieren, ohne Dich dabei in Details zu verlieren.

 


 


Hast Du noch Fragen oder brauchst Du Hilfe bei Deiner MLOps-Journey? Kontaktiere uns.
Wir helfen Dir gerne auf die Sprünge.

Melde Dich gerne hier!

 

 

 

Dein Ansprechpartner
Laurenz Reitsam
Consultant
Laurenz ist Data Scientist der sich neben Machine Learning und Datenanalysen auch für DevOps und Infrastruktur begeistert. Er ist davon überzeugt, dass ein Modell nur dann ein gutes Modell sein kann, wenn es seinen Weg in die Produktion schafft.
#Pythonist #GCP #DataScience