Anyscale lancia uno strumento automatizzato di post-training per il fine-tuning degli LLM

Anyscale ha rilasciato un nuovo strumento progettato per semplificare la fase di post-training dei grandi modelli linguistici, automatizzando attività come la selezione della metodologia, la pianificazione della GPU e la generazione di configurazioni. L'azienda afferma che mira a semplificare ciò che è diventata una parte complessa e dispendiosa in termini di risorse del deployment degli LLM in produzione.

Cosa automatizza lo strumento

Lo strumento si concentra sul processo di fine-tuning, che tipicamente richiede agli ingegneri di scegliere manualmente tra approcci come full fine-tuning, LoRA o QLoRA, per poi determinare la corretta configurazione della GPU e gli iperparametri. Il sistema di Anyscale prende in carico queste decisioni, generando una configurazione che corrisponde al modello e ai vincoli hardware dell'utente. L'azienda sostiene che ciò possa ridurre i tempi di prova ed errore e diminuire il rischio di esecuzioni mal configurate.

Perché il post-training è importante ora

Con l'avanzare delle organizzazioni dalla sperimentazione degli LLM al loro effettivo deployment, il fine-tuning è diventato un collo di bottiglia. I modelli standard spesso necessitano di aggiustamenti per domini o compiti specifici, ma il processo richiede conoscenze specialistiche e spesso porta a cicli GPU sprecati. Lo strumento di Anyscale affronta questo problema trattando il post-training come una pipeline automatizzata anziché una serie di passaggi manuali.

Pianificazione della GPU integrata

Una parte fondamentale dello strumento è la sua capacità di pianificare l'uso della GPU. Stima la memoria e la potenza di calcolo necessarie per un dato modello e metodo di fine-tuning, quindi suggerisce un numero e un tipo appropriati di GPU. Ciò potrebbe aiutare i team a evitare un provisioning eccessivo o la mancanza di memoria durante l'esecuzione. Anyscale posiziona questa soluzione come pratica per i team che devono fare fine-tuning dei modelli senza dedicare un intero team di ingegneri ML al compito.

Disponibilità del rilascio

Lo strumento è ora disponibile come parte della piattaforma di Anyscale. Gli utenti possono testarlo sull'infrastruttura dell'azienda. Non è chiaro come lo strumento gestirà modelli molto grandi o configurazioni hardware esotiche, e Anyscale non ha ancora pubblicato confronti benchmark rispetto ai flussi di lavoro di fine-tuning manuale. L'azienda afferma che continuerà ad aggiornare lo strumento in base al feedback degli utenti.

Cosa automatizza lo strumento

Perché il post-training è importante ora

Pianificazione della GPU integrata

Disponibilità del rilascio

Articoli Correlati