MiniMax Menggoda Model AI M3 dengan Penyahkodan 15.6x Lebih Pantas untuk AI Terdesentralisasi

MiniMax telah menggoda model M3 yang akan datang, menjanjikan peningkatan 15.6x dalam kelajuan pemahaman. Syarikat itu berkata model ini dibina untuk mengubah semula AI terdesentralisasi dengan mengurangkan kependaman dan kos.

Maksud peningkatan kelajuan

Kelajuan pemahaman adalah masa yang diambil oleh AI untuk menghasilkan output daripada input. Peningkatan 15.6x bermakna tugas yang dahulunya mengambil masa beberapa saat boleh berlaku dalam milisaat. Untuk AI terdesentralisasi—di mana pemprosesan berlaku merentasi nod teragih dan bukannya pelayan berpusat—ini sangat penting. Kependaman yang lebih rendah menjadikan aplikasi masa nyata seperti pembantu suara atau terjemahan langsung lebih boleh dilaksanakan pada rangkaian terdesentralisasi.

Tumpuan pada kos dan skalabiliti

MiniMax meletakkan M3 sebagai penyelesaian untuk dua masalah berterusan dalam AI terdesentralisasi: kos pengiraan yang tinggi dan skalabiliti yang terhad. Syarikat itu mendakwa model ini mengurangkan kos sambil meningkatkan kecekapan. Ini boleh menarik minat pembangun yang teragak-agak untuk membina infrastruktur terdesentralisasi kerana pertukaran harga dan prestasi.

M3 meningkatkan skalabiliti dengan mengendalikan lebih banyak permintaan sesaat dengan sumber yang lebih sedikit. Itu adalah jawapan langsung kepada kesesakan yang membuatkan banyak projek AI terikat dengan pembekal awan berpusat.

Belum ada tarikh keluaran

MiniMax belum mengumumkan bila M3 akan tersedia. Syarikat itu masih dalam fasa menggoda, menawarkan sedikit butiran teknikal selain daripada angka kelajuan pemahaman. Pembangun dan peminat AI terdesentralisasi perlu menunggu penanda aras atau keluaran beta untuk melihat sama ada tuntutan itu benar.

Maksud peningkatan kelajuan

Tumpuan pada kos dan skalabiliti

Belum ada tarikh keluaran

Related Articles