Η MiniMax παρουσίασε το επερχόμενο μοντέλο M3, υποσχόμενη επιτάχυνση 15,6 φορές στην ταχύτητα κατανόησης. Η εταιρεία δηλώνει ότι το μοντέλο έχει σχεδιαστεί για να αναδιαμορφώσει την αποκεντρωμένη ΤΝ, μειώνοντας την καθυστέρηση και το κόστος.
Τι σημαίνει η επιτάχυνση
Η ταχύτητα κατανόησης είναι ο χρόνος που χρειάζεται η ΤΝ για να παράγει έξοδο από μια είσοδο. Μια βελτίωση 15,6 φορές σημαίνει ότι εργασίες που κάποτε διαρκούσαν δευτερόλεπτα μπορεί να γίνονται σε χιλιοστά του δευτερολέπτου. Για την αποκεντρωμένη ΤΝ—όπου η επεξεργασία γίνεται σε κατανεμημένους κόμβους αντί για κεντρικούς διακομιστές—αυτό έχει μεγάλη σημασία. Η χαμηλότερη καθυστέρηση καθιστά πιο εφικτές εφαρμογές πραγματικού χρόνου, όπως φωνητικοί βοηθοί ή ζωντανή μετάφραση, σε αποκεντρωμένα δίκτυα.
Εστίαση στο κόστος και την κλιμάκωση
Η MiniMax τοποθετεί το M3 ως λύση για δύο διαρκείς προκλήσεις στην αποκεντρωμένη ΤΝ: το υψηλό υπολογιστικό κόστος και την περιορισμένη κλιμάκωση. Η εταιρεία ισχυρίζεται ότι το μοντέλο μειώνει το κόστος ενώ βελτιώνει την απόδοση. Αυτό θα μπορούσε να προσελκύσει προγραμματιστές που δίσταζαν να χτίσουν σε αποκεντρωμένη υποδομή λόγω συμβιβασμών στην τιμή και την απόδοση.
Το M3 ενισχύει την κλιμάκωση διαχειριζόμενο περισσότερα αιτήματα ανά δευτερόλεπτο με λιγότερους πόρους. Αυτή είναι μια άμεση απάντηση στο σημείο συμφόρησης που κρατά πολλά έργα ΤΝ προσκολλημένα σε κεντρικούς παρόχους cloud.
Ακόμα χωρίς ημερομηνία κυκλοφορίας
Η MiniMax δεν έχει ανακοινώσει πότε θα διατεθεί το M3. Η εταιρεία βρίσκεται ακόμα στη φάση της παρουσίασης, προσφέροντας ελάχιστες τεχνικές λεπτομέρειες πέρα από τον αριθμό της ταχύτητας κατανόησης. Οι προγραμματιστές και οι λάτρεις της αποκεντρωμένης ΤΝ θα πρέπει να περιμένουν σημεία αναφοράς ή μια beta έκδοση για να δουν αν οι ισχυρισμοί ισχύουν.




