Navigieren in der ML-Grenze Teil II: Den ML-Entwicklungslebenszyklus verstehen | von Rajat Patel | Juni 2023

0
27


Dieser Abschnitt bietet einen Überblick über den Lebenszyklus der ML-Systementwicklung, von der Erfassung von Daten in Bezug auf ein Geschäftsproblem über die Beantwortung dieses Issues mit einem ML-Modell bis hin zur Bereitstellung des Modells in der Produktion für den realen Einsatz.

Lebenszyklus der ML-Systementwicklung

Der ML-Entwicklungslebenszyklus besteht normalerweise aus den folgenden Phasen

  1. Datensammlung: In dieser ersten Section geht es darum, relevante Daten aus verschiedenen Quellen zu sammeln, deren Qualität sicherzustellen und sie für nachfolgende Phasen aufzubereiten.
  2. Datenkennzeichnung: In dieser Section werden die Daten beschriftet oder mit Anmerkungen versehen, um die notwendigen Informationen für das Coaching von ML-Modellen bereitzustellen. Beschriftungen können von menschlichen Annotatoren zugewiesen oder durch automatisierte Prozesse generiert werden.
  3. Datenvorverarbeitung: Die gesammelten Daten müssen häufig vorverarbeitet werden, um sicherzustellen, dass sie für das Coaching von ML-Modellen geeignet sind. Dazu gehören Aufgaben wie Datenbereinigung, Normalisierung, Merkmalsextraktion und Umgang mit fehlenden Werten.
  4. Modellschulung: In dieser Section werden ML-Modelle mithilfe der gekennzeichneten und vorverarbeiteten Daten trainiert. Die Modelle lernen aus den Eingabedaten und passen ihre internen Parameter an, um ihre Leistung bei der gewünschten Aufgabe zu optimieren.
  5. Modellbewertung: Die Modellbewertung ist entscheidend für die Beurteilung ihrer Leistung und Generalisierungsfähigkeiten. In dieser Section werden verschiedene Metriken gemessen, eine Kreuzvalidierung durchgeführt und die Stärken und Schwächen des Modells analysiert.
  6. Modellinferenzbildung: Sobald das trainierte Modell als zufriedenstellend erachtet wird, wird es für die Schlussfolgerung vorbereitet. Dazu gehört das Packen des Modells, das Einrichten der erforderlichen Infrastruktur und das Optimieren für das effiziente Vorhersageproblem, das Sie lösen.
  7. Modellbereitstellung: In dieser Section wird das trainierte und verpackte Modell in einer Produktionsumgebung bereitgestellt und steht für Echtzeitvorhersagen oder die Verwendung innerhalb des vorgesehenen Methods oder der vorgesehenen Anwendung zur Verfügung.
  8. Mannequin-in-the-Wild-Bewertung (A/B-Checks): Nach der Bereitstellung ist es wichtig zu beurteilen, wie sich das Modell in realen Szenarien verhält. A/B-Checks oder andere Bewertungsmethoden werden eingesetzt, um die Leistung verschiedener Modelle oder Versionen zu vergleichen und Erkenntnisse für weitere Verbesserungen zu sammeln.
  9. Go-Reside des Modells: Sobald das Modell einer gründlichen Evaluierung unterzogen wurde und die gewünschten Leistungskriterien erfüllt, wird es offiziell in die Produktion für eine breitere Nutzung freigegeben, sodass die Auswirkungen für die Endbenutzer spürbar sind

In den folgenden Abschnitten untersuchen wir effektive Kooperations- und Kommunikationsstrategien, die Programm- und Produktmanager einsetzen können, um die Grenzen der Entwicklung von ML-Produkten erfolgreich zu überwinden. Diese Strategien zielen darauf ab, ihre Fähigkeit zu verbessern, nahtlos mit funktionsübergreifenden Groups zusammenzuarbeiten und ihre Ziele im ML-Entwicklungsprozess zu erreichen.



Source link

HINTERLASSEN SIE EINE ANTWORT

Please enter your comment!
Please enter your name here