Loading market data...

Anyscale veröffentlicht automatisiertes Post-Training-Tool für LLM-Feinabstimmung

Anyscale veröffentlicht automatisiertes Post-Training-Tool für LLM-Feinabstimmung

Anyscale hat ein neues Tool veröffentlicht, das die Post-Training-Phase für große Sprachmodelle optimiert und Aufgaben wie Methodenauswahl, GPU-Planung und Konfigurationserstellung automatisiert. Das Unternehmen gibt an, damit einen komplexen und ressourcenintensiven Teil der Bereitstellung von LLMs in der Produktion zu vereinfachen.

Was das Tool automatisiert

Das Tool konzentriert sich auf den Feinabstimmungsprozess, bei dem Ingenieure normalerweise manuell zwischen Ansätzen wie vollständiger Feinabstimmung, LoRA oder QLoRA wählen und dann die richtige GPU-Einrichtung und Hyperparameter ermitteln müssen. Anyscale's System übernimmt diese Entscheidungen und generiert eine Konfiguration, die zum Modell und den Hardware-Beschränkungen des Benutzers passt. Das Unternehmen behauptet, dass dies die Trial-and-Error-Zeit verkürzen und das Risiko fehlerhafter Läufe verringern kann.

Warum Post-Training jetzt wichtig ist

Da Unternehmen vom Experimentieren mit LLMs zur tatsächlichen Bereitstellung übergehen, ist die Feinabstimmung zu einem Engpass geworden. Standardmodelle benötigen oft Anpassungen für bestimmte Domänen oder Aufgaben, aber der Prozess erfordert spezielles Wissen und führt oft zu verschwendeten GPU-Zyklen. Anyscale's Tool adressiert dies, indem es Post-Training als automatisierte Pipeline behandelt, anstatt als eine Reihe manueller Schritte.

GPU-Planung integriert

Ein zentraler Bestandteil des Tools ist die Fähigkeit, die GPU-Nutzung zu planen. Es schätzt den Speicher- und Rechenaufwand für ein gegebenes Modell und eine Feinabstimmungsmethode und schlägt dann eine geeignete Anzahl und Art von GPUs vor. Das könnte Teams helfen, Überbereitstellung oder Speichermangel während des Jobs zu vermeiden. Anyscale positioniert dies als praktische Lösung für Teams, die Modelle feinabstimmen müssen, ohne ein ganzes Team von ML-Ingenieuren dafür abzustellen.

Verfügbarkeit der Veröffentlichung

Das Tool ist ab sofort als Teil der Anyscale-Plattform verfügbar. Benutzer können es auf der Infrastruktur des Unternehmens testen. Es ist unklar, wie das Tool mit sehr großen Modellen oder exotischen Hardware-Setups umgeht, und Anyscale hat noch keine Benchmark-Vergleiche mit manuellen Feinabstimmungs-Workflows veröffentlicht. Das Unternehmen sagt, dass es das Tool basierend auf Benutzerfeedback weiter aktualisieren wird.