Loading market data...

Anyscale Launches Automated Post-Training Tool for LLM Fine-Tuning

Anyscale Launches Automated Post-Training Tool for LLM Fine-Tuning
or

or

. Just translate text inside. Let me write the translations: Title: "Η Anyscale λανσάρει αυτοματοποιημένο εργαλείο μετα-εκπαίδευσης για λεπτομερή ρύθμιση LLM" Content:

Η Anyscale κυκλοφόρησε ένα νέο εργαλείο σχεδιασμένο να βελτιστοποιεί τη φάση μετα-εκπαίδευσης για μεγάλα γλωσσικά μοντέλα, αυτοματοποιώντας εργασίες όπως η επιλογή μεθοδολογίας, ο σχεδιασμός GPU και η δημιουργία διαμόρφωσης. Η εταιρεία αναφέρει ότι στοχεύει να απλοποιήσει αυτό που έχει γίνει ένα πολύπλοκο και απαιτητικό σε πόρους μέρος της ανάπτυξης LLM σε παραγωγή.

Τι αυτοματοποιεί το εργαλείο

Το εργαλείο επικεντρώνεται στη διαδικασία λεπτομερούς ρύθμισης, η οποία συνήθως απαιτεί από τους μηχανικούς να επιλέξουν χειροκίνητα μεταξύ προσεγγίσεων όπως πλήρης λεπτομερής ρύθμιση, LoRA ή QLoRA, και στη συνέχεια να καθορίσουν τη σωστή ρύθμιση GPU και υπερπαραμέτρους. Το σύστημα της Anyscale αναλαμβάνει αυτές τις αποφάσεις, δημιουργώντας μια διαμόρφωση που ταιριάζει με το μοντέλο και τους περιορισμούς υλικού του χρήστη. Η εταιρεία ισχυρίζεται ότι αυτό μπορεί να μειώσει τον χρόνο δοκιμής και σφάλματος και να μειώσει τον κίνδυνο εσφαλμένων ρυθμίσεων.

Γιατί η μετα-εκπαίδευση έχει σημασία τώρα

Καθώς οι οργανισμοί μετακινούνται από τον πειραματισμό με LLM στην πραγματική ανάπτυξη, η λεπτομερής ρύθμιση έχει γίνει σημείο συμφόρησης. Τα έτοιμα μοντέλα συχνά χρειάζονται προσαρμογές για συγκεκριμένους τομείς ή εργασίες, αλλά η διαδικασία απαιτεί εξειδικευμένες γνώσεις και συχνά οδηγεί σε σπατάλη κύκλων GPU. Το εργαλείο της Anyscale αντιμετωπίζει αυτό το πρόβλημα αντιμετωπίζοντας τη μετα-εκπαίδευση ως μια αυτοματοποιημένη γραμμή παραγωγής αντί για μια σειρά χειροκίνητων βημάτων.

Ενσωματωμένος σχεδιασμός GPU

Ένα βασικό μέρος του εργαλείου είναι η ικανότητά του να σχεδιάζει τη χρήση GPU. Υπολογίζει την απαιτούμενη μνήμη και υπολογιστική ισχύ για ένα δεδομένο μοντέλο και μέθοδο λεπτομερούς ρύθμισης, και στη συνέχεια προτείνει έναν κατάλληλο αριθμό και τύπο GPU. Αυτό θα μπορούσε να βοηθήσει τις ομάδες να αποφύγουν την υπερ-παροχή ή την εξάντληση μνήμης κατά τη διάρκεια της εργασίας. Η Anyscale τοποθετεί αυτό ως μια πρακτική λύση για ομάδες που χρειάζονται να κάνουν λεπτομερή ρύθμιση μοντέλων χωρίς να αφιερώνουν μια ολόκληρη ομάδα μηχανικών μηχανικής μάθησης σε αυτή την εργασία.

Διαθεσιμότητα κυκλοφορίας

Το εργαλείο είναι διαθέσιμο τώρα ως μέρος της πλατφόρμας της Anyscale. Οι χρήστες μπορούν να το δοκιμάσουν στην υποδομή της εταιρείας. Δεν είναι σαφές πώς το εργαλείο θα χειριστεί πολύ μεγάλα μοντέλα ή εξωτικές ρυθμίσεις υλικού, και η Anyscale δεν έχει ακόμη δημοσιεύσει συγκρίσεις αναφοράς έναντι χειροκίνητων ροών εργασίας λεπτομερούς ρύθμισης. Η εταιρεία αναφέρει ότι θα συνεχίσει να ενημερώνει το εργαλείο βάσει σχολίων των χρηστών.