Kubeflow 1.0: Die vollständige Machine-Learning-Lösung für Kubernetes

Kubeflow: Die Machine-Learning-Werkzeugkiste für Kubernetes erreicht Version 1.0

Der Open-Source-Softwarestack Kubeflow hat das Release 1.0 erreicht. Kubeflow ist ein Werkzeugkasten zur Automatisierung von Machine-Learning-Workflows auf Kubernetes-Clustern. Die Version 1.0 bietet diverse neue Funktionen wie eine verbesserte Unterstützung von TensorFlow-Modellen, einfacheres Deployment von Modellen, sowie vereinfachte Monitoring- und Feedbacktools. Kubeflow erleichtert das Training von Machine-Learning-Modellen und stellt eine nahtlose Integration von Tools und Funktionen bereit, um die gesamte Machine-Learning-Pipeline von der Datenvorbereitung bis zur Bereitstellung zu automatisieren.



Mit der nun vorliegenden Version 1.0 sollen Werkzeuge zum Entwickeln, Bauen, Trainieren und Deployen von Machine-Learning-Modellen zum Einsatz bereit sein. Das Projekt erblickte im Rahmen der Kubecon USA im Dezember 2017 das Licht der Cloud-nativen Welt.


Ein Überblick zu Kubeflow


Im Kern umfasst Kubeflow mehrere Werkzeuge, die verschiedene Aufgaben des Machine Learning bewältigen sollen. Als stabil gelten nun das zentrale Dashboard, das Entwicklern einen Überblick über die ausgerollten Kubeflow-Komponenten in einem Cluster geben soll. Dort können sie auch neue Jupyter Notebooks aufsetzen und den jeweiligen Notebooks die benötigten Ressourcen für die Entwicklung zuweisen. Wie bei vielen Data Scientists und Machine-Learning-Anwendern üblich sind die Jupyter Notebooks ein zentraler Baustein für die Entwicklung der Applikationen.


Ebenfalls als stabil gelten der Tensorflow Operator TFJob und der PyTorch Operator. Sie bauen auf dem ursprünglich von CoreOS entwickeltem Prinzip der Operator auf, das Applikationen nativ in Kubernetes einbindet. Sie sollen sich vor allem um das verteilte Trainieren der Modelle kümmern. Das sei mit Kubernetes einfach möglich und würde der Art und Weise entsprechen, wie Google selbst Machine-Learning-Modelle trainiert.


Außerdem umfasst Kubeflow mit kfctl ein Command-line Interface (CLI), das die Deployment-Aufgaben übernimmt. Entwickler können so Kubeflow einem bestehenden Kubernetes-Cluster zu ordnen. Zu guter Letzt gilt auch der Profile-Controller als stabil, der sich um das Verwalten mehrerer Nutzer kümmern soll.


Die weiteren Pläne für Kubeflow



Im Blogbeitrag zum Release gehen die Entwickler auf die anstehenden Entwicklungen von Kubeflow ein. Die Tools Pipelines, Metadata und Katib liegen momentan noch als Beta vor und sollen als Nächstes auf Version 1.0 springen.


Sie erlauben die Definitionen von Workflows (Pipelines), das Tracking von Datasets und Modellen (Metadata) sowie ein Tuning von Hyper-Parametern (Katib). Im Einsatz haben Kubeflow wohl unter anderem Unternehmen wie Volvo, One Technologies und diverse amerikanische Banken.


Zuletzt aktualisiert am Uhr



Kommentare


Anzeige