Anyscale a dévoilé un nouvel outil conçu pour simplifier la phase de post-entraînement des grands modèles de langage, en automatisant des tâches telles que la sélection de méthodologie, la planification GPU et la génération de configuration. L'entreprise affirme vouloir ainsi faciliter ce qui est devenu une étape complexe et gourmande en ressources dans le déploiement des LLM en production.
Ce que l'outil automatise
L'outil se concentre sur le processus de fine-tuning, qui exige généralement des ingénieurs de choisir manuellement entre des approches comme le fine-tuning complet, LoRA ou QLoRA, puis de déterminer la configuration GPU et les hyperparamètres appropriés. Le système d'Anyscale prend en charge ces décisions, générant une configuration adaptée au modèle et aux contraintes matérielles de l'utilisateur. L'entreprise affirme que cela peut réduire le temps d'essais et erreurs ainsi que le risque d'exécutions mal configurées.
Pourquoi le post-entraînement est important aujourd'hui
Alors que les organisations passent de l'expérimentation avec les LLM à leur déploiement effectif, le fine-tuning est devenu un goulot d'étranglement. Les modèles prêts à l'emploi nécessitent souvent des ajustements pour des domaines ou des tâches spécifiques, mais le processus requiert des connaissances spécialisées et entraîne souvent des cycles GPU gaspillés. L'outil d'Anyscale répond à ce problème en traitant le post-entraînement comme un pipeline automatisé plutôt qu'une série d'étapes manuelles.
Planification GPU intégrée
Un élément clé de l'outil est sa capacité à planifier l'utilisation du GPU. Il estime la mémoire et la puissance de calcul nécessaires pour un modèle et une méthode de fine-tuning donnés, puis suggère un nombre et un type de GPU appropriés. Cela peut aider les équipes à éviter le surprovisionnement ou une panne de mémoire en cours de tâche. Anyscale présente cela comme une solution pratique pour les équipes qui doivent effectuer du fine-tuning sans consacrer une équipe entière d'ingénieurs ML à cette tâche.
Disponibilité de la version
L'outil est disponible dès maintenant dans le cadre de la plateforme d'Anyscale. Les utilisateurs peuvent le tester sur l'infrastructure de l'entreprise. On ne sait pas encore comment l'outil gérera les très grands modèles ou les configurations matérielles exotiques, et Anyscale n'a pas encore publié de comparaisons de performances par rapport aux workflows de fine-tuning manuels. L'entreprise indique qu'elle continuera à mettre à jour l'outil en fonction des retours des utilisateurs.




