Η Perplexity ξεκίνησε να εξυπηρετεί τα μοντέλα Qwen3 235B σε racks Nvidia GB200, μια κίνηση που προσφέρει σημαντικά κέρδη στην απόδοση εξαγωγής συμπερασμάτων. Η ανάπτυξη, που αναφέρθηκε πρώτη φορά από το Crypto Briefing, υπογραμμίζει τη συνεχιζόμενη πρωτοπορία της Nvidia στον τομέα του υλικού AI και θα μπορούσε να αλλάξει τη δυναμική του ανταγωνισμού στην εξυπηρέτηση μεγάλων μοντέλων.
Κέρδη στην εξαγωγή συμπερασμάτων στο GB200
Η μετάβαση σε racks GB200 δίνει στην Perplexity μια αισθητή βελτίωση στο πόσο γρήγορα μπορεί να εκτελέσει το μοντέλο Qwen3 των 235 δισεκατομμυρίων παραμέτρων. Η απόδοση (throughput) και η καθυστέρηση (latency) της εξαγωγής συμπερασμάτων βελτιώθηκαν, αν και η εταιρεία δεν έχει δημοσιεύσει συγκεκριμένες μετρήσεις. Τα κέρδη προέρχονται από τη στενή ενσωμάτωση της CPU Grace και της GPU Blackwell της Nvidia, η οποία μειώνει τα σημεία συμφόρησης στη μεταφορά δεδομένων.
Το πλεονέκτημα υλικού της Nvidia
Αυτή η ανάπτυξη είναι ένα ακόμη παράδειγμα του ότι η Nvidia προηγείται στην κούρσα των τσιπ AI. Τα racks GB200 είναι σχεδιασμένα ακριβώς για τέτοιου είδους φορτία εργασίας υψηλών παραμέτρων, και η επιλογή της Perplexity υποδηλώνει ότι το υλικό αποδίδει εκεί που έχει σημασία. Ανταγωνιστές όπως η AMD και η Intel αντιμετωπίζουν μια δύσκολη ανάβαση για να φτάσουν αυτή την απόδοση σε κλίμακα.
Επιτάχυνση της ανάπτυξης μοντέλων
Με καλύτερη εξαγωγή συμπερασμάτων, η Perplexity μπορεί να κυκλοφορεί ενημερώσεις και νέα μοντέλα πιο γρήγορα. Το Qwen3 235B είναι ένα πυκνό, ισχυρό μοντέλο, και η αποτελεσματική εκτέλεσή του σημαίνει λιγότερο χρόνο μεταξύ εκπαίδευσης και παραγωγής. Αυτή η ταχύτητα έχει σημασία καθώς η κούρσα για την ανάπτυξη ολοένα και μεγαλύτερων γλωσσικών μοντέλων εντείνεται.
Η κίνηση θα μπορούσε να ασκήσει πίεση σε άλλους παρόχους εξαγωγής συμπερασμάτων να αναβαθμίσουν το υλικό τους ή να ρισκάρουν να μείνουν πίσω. Εάν η Perplexity διατηρήσει αυτό το πλεονέκτημα, μπορεί να προσελκύσει περισσότερους προγραμματιστές AI που χρειάζονται εξυπηρέτηση υψηλής απόδοσης και χαμηλής καθυστέρησης. Οι επόμενοι μήνες θα δείξουν αν οι αντίπαλοι μπορούν να κλείσουν το χάσμα ή αν το GB200 της Nvidia γίνει το de facto πρότυπο για βαριά μοντέλα.




