Loading market data...

Anyscale uvádí automatizovaný nástroj pro post-tréninkové doladění LLM

Anyscale uvádí automatizovaný nástroj pro post-tréninkové doladění LLM

Společnost Anyscale vydala nový nástroj určený k zefektivnění post-tréninkové fáze u velkých jazykových modelů, který automatizuje úkoly, jako je výběr metodiky, plánování GPU a generování konfigurace. Firma uvádí, že jeho cílem je zjednodušit to, co se stalo složitou a náročnou součástí nasazování LLM do produkce.

Co nástroj automatizuje

Nástroj se zaměřuje na proces doladění, který obvykle vyžaduje, aby inženýři ručně volili mezi přístupy, jako je plné doladění, LoRA nebo QLoRA, a následně určili správné nastavení GPU a hyperparametry. Systém Anyscale přebírá tato rozhodnutí a generuje konfiguraci odpovídající modelu a hardwarovým omezením uživatele. Firma tvrdí, že to může zkrátit čas strávený metodou pokus-omyl a snížit riziko špatně nakonfigurovaných běhů.

Proč je post-trénink nyní důležitý

Jak organizace přecházejí od experimentování s LLM k jejich skutečnému nasazení, stalo se doladění úzkým hrdlem. Předpřipravené modely často vyžadují úpravy pro konkrétní domény nebo úkoly, ale tento proces vyžaduje specializované znalosti a často vede k plýtvání GPU cykly. Nástroj Anyscale to řeší tím, že post-trénink pojímá jako automatizované pipeline, nikoli jako sérii manuálních kroků.

Plánování GPU jako součást nástroje

Klíčovou součástí nástroje je jeho schopnost plánovat využití GPU. Odhaduje paměťové a výpočetní nároky pro daný model a metodu doladění a poté navrhne vhodný počet a typ GPU. To může týmům pomoci vyhnout se předimenzování nebo nedostatku paměti uprostřed úlohy. Anyscale toto staví jako praktické řešení pro týmy, které potřebují doladit modely, aniž by musely vyčlenit celý tým ML inženýrů.

Dostupnost vydání

Nástroj je nyní k dispozici jako součást platformy Anyscale. Uživatelé jej mohou testovat na infrastruktuře společnosti. Není jasné, jak si nástroj poradí s velmi velkými modely nebo exotickými hardwarovými sestavami, a Anyscale dosud nezveřejnil srovnávací testy oproti manuálním workflow doladění. Firma uvádí, že bude nástroj průběžně aktualizovat na základě zpětné vazby uživatelů.