MiniMax ปล่อยทีเซอร์โมเดล AI M3 พร้อมความเร็วในการถอดรหัสเร็วกว่า 15.6 เท่า สำหรับ AI แบบกระจายศูนย์

MiniMax ได้ปล่อยทีเซอร์โมเดล M3 ที่กำลังจะมาถึง โดยสัญญาว่าจะเพิ่มความเร็วในการทำความเข้าใจถึง 15.6 เท่า บริษัทกล่าวว่าโมเดลดังกล่าวถูกสร้างขึ้นเพื่อพลิกโฉม AI แบบกระจายศูนย์ด้วยการลดค่าเวลาแฝงและต้นทุน

ความหมายของการเพิ่มความเร็ว

ความเร็วในการทำความเข้าใจคือเวลาที่ AI ใช้ในการสร้างผลลัพธ์จากข้อมูลนำเข้า การปรับปรุง 15.6 เท่าหมายความว่างานที่เคยใช้เวลาเป็นวินาทีสามารถเกิดขึ้นในหน่วยมิลลิวินาที สำหรับ AI แบบกระจายศูนย์—ซึ่งการประมวลผลเกิดขึ้นบนโหนดแบบกระจายแทนที่จะเป็นเซิร์ฟเวอร์แบบรวมศูนย์—สิ่งนี้มีความสำคัญอย่างมาก เวลาแฝงที่ต่ำลงทำให้แอปพลิเคชันแบบเรียลไทม์ เช่น ผู้ช่วยเสียงหรือการแปลสด เป็นไปได้มากขึ้นบนเครือข่ายแบบกระจายศูนย์

มุ่งเน้นต้นทุนและความสามารถในการปรับขนาด

MiniMax กำลังวางตำแหน่ง M3 เป็นโซลูชันสำหรับปัญหาสองประการที่เกิดขึ้นอย่างต่อเนื่องใน AI แบบกระจายศูนย์ ได้แก่ ต้นทุนการคำนวณที่สูงและความสามารถในการปรับขนาดที่จำกัด บริษัทอ้างว่าโมเดลนี้ช่วยลดต้นทุนในขณะที่เพิ่มประสิทธิภาพ ซึ่งอาจดึงดูดนักพัฒนาที่ลังเลที่จะสร้างบนโครงสร้างพื้นฐานแบบกระจายศูนย์เนื่องจากการแลกเปลี่ยนระหว่างราคาและประสิทธิภาพ

M3 ช่วยเพิ่มความสามารถในการปรับขนาดด้วยการจัดการคำขอต่อวินาทีมากขึ้นโดยใช้ทรัพยากรน้อยลง นั่นคือคำตอบโดยตรงสำหรับคอขวดที่ทำให้โครงการ AI จำนวนมากต้องพึ่งพาผู้ให้บริการคลาวด์แบบรวมศูนย์

ยังไม่มีวันวางจำหน่าย

MiniMax ยังไม่ได้ประกาศว่า M3 จะพร้อมใช้งานเมื่อใด บริษัทยังอยู่ในช่วงปล่อยทีเซอร์ โดยให้รายละเอียดทางเทคนิคเพียงเล็กน้อยนอกเหนือจากตัวเลขความเร็วในการทำความเข้าใจ นักพัฒนาและผู้ที่สนใจ AI แบบกระจายศูนย์จะต้องรอการวัดประสิทธิภาพหรือการเปิดตัวรุ่นเบต้าเพื่อดูว่าข้ออ้างดังกล่าวเป็นจริงหรือไม่

ความหมายของการเพิ่มความเร็ว

มุ่งเน้นต้นทุนและความสามารถในการปรับขนาด

ยังไม่มีวันวางจำหน่าย

Related Articles