Loading market data...

Anyscale bringt persistente Daten und Debugging mit neuen Dashboards zu Ray

Anyscale bringt persistente Daten und Debugging mit neuen Dashboards zu Ray

Anyscale hat neue Cluster- und Actor-Dashboards für sein verteiltes Rechen-Framework Ray veröffentlicht. Die Tools versprechen vollständige Datenpersistenz und erweiterte Debugging-Funktionen für Entwickler, die KI-Workloads über Cluster hinweg betreiben.

Warum Persistenz für verteilte KI wichtig ist

In verteilten Systemen kann die Nachverfolgung von Ereignissen über tausende von Knoten hinweg ein Albtraum sein. Logs gehen verloren, Metriken verschwinden. Anyscale zufolge lösen die neuen Dashboards dieses Problem, indem sie Daten nicht nur im Arbeitsspeicher, sondern persistent auf der Festplatte speichern. Das bedeutet, dass Entwickler den Zustand eines Clusters oder eines Actors Stunden oder Tage später überprüfen können, anstatt einen flüchtigen Fehler in Echtzeit abfangen zu müssen.

Ein genauerer Blick auf die Cluster- und Actor-Dashboards

Das Cluster-Dashboard bietet einen Überblick über den gesamten Ray-Cluster: wie viele Knoten aktiv sind, welche Ressourcen sie nutzen und wo Aufgaben in der Warteschlange stehen. Das Actor-Dashboard zoomt auf einzelne Actors – die leichtgewichtigen Prozesse, die in verteilten KI-Jobs die Arbeit erledigen. Beide Dashboards bieten jetzt vollständige Datenpersistenz, sodass die Informationen auch nach Abschluss eines Jobs erhalten bleiben.

Anyscale betonte auch den Debugging-Aspekt. Wenn in einem verteilten Training oder einer Verstärkungslernschleife etwas schiefgeht, ist es oft schwierig, die Ursache zu finden. Die persistenten Dashboards ermöglichen es Entwicklern, die Ereigniszeitachse abzuspielen – wie ein DVR für verteilte Systeme.

Was das für Ray-Nutzer bedeutet

Ray ist bereits beliebt für Machine-Learning-Pipelines, Modellbereitstellung und groß angelegte Simulationen. Die neuen Dashboards zielen darauf ab, die Zeit zu verkürzen, die Ingenieure mit der Fehlersuche verbringen. Anstatt Logs von Dutzenden von Maschinen zusammenzuflicken, können sie ein einzelnes Dashboard aufrufen, das die Zustandsänderungen der Actors über den gesamten Lebenszyklus eines Jobs zeigt.

Das ist ein großer Fortschritt für Teams, die komplexe KI-Workloads betreiben. Mit persistenten Daten können sie Engpässe identifizieren, fehlgeschlagene Aufgaben aufspüren und Ressourcennutzungsmuster verstehen, ohne für jedes neue Experiment die Infrastruktur neu aufbauen zu müssen.

Anyscale's Update kommt zu einem Zeitpunkt, an dem immer mehr Organisationen Ray für KI in der Produktion einsetzen. Die neuen Dashboards sind ab sofort verfügbar, und das Unternehmen sagt, sie seien Teil einer breiteren Initiative, um verteiltes Rechnen für Entwickler zugänglicher zu machen, die keine Systemexperten sind.