MiniMax ได้ปล่อยทีเซอร์โมเดล M3 ที่กำลังจะมาถึง โดยสัญญาว่าจะเพิ่มความเร็วในการทำความเข้าใจถึง 15.6 เท่า บริษัทกล่าวว่าโมเดลดังกล่าวถูกสร้างขึ้นเพื่อพลิกโฉม AI แบบกระจายศูนย์ด้วยการลดค่าเวลาแฝงและต้นทุน
ความหมายของการเพิ่มความเร็ว
ความเร็วในการทำความเข้าใจคือเวลาที่ AI ใช้ในการสร้างผลลัพธ์จากข้อมูลนำเข้า การปรับปรุง 15.6 เท่าหมายความว่างานที่เคยใช้เวลาเป็นวินาทีสามารถเกิดขึ้นในหน่วยมิลลิวินาที สำหรับ AI แบบกระจายศูนย์—ซึ่งการประมวลผลเกิดขึ้นบนโหนดแบบกระจายแทนที่จะเป็นเซิร์ฟเวอร์แบบรวมศูนย์—สิ่งนี้มีความสำคัญอย่างมาก เวลาแฝงที่ต่ำลงทำให้แอปพลิเคชันแบบเรียลไทม์ เช่น ผู้ช่วยเสียงหรือการแปลสด เป็นไปได้มากขึ้นบนเครือข่ายแบบกระจายศูนย์
มุ่งเน้นต้นทุนและความสามารถในการปรับขนาด
MiniMax กำลังวางตำแหน่ง M3 เป็นโซลูชันสำหรับปัญหาสองประการที่เกิดขึ้นอย่างต่อเนื่องใน AI แบบกระจายศูนย์ ได้แก่ ต้นทุนการคำนวณที่สูงและความสามารถในการปรับขนาดที่จำกัด บริษัทอ้างว่าโมเดลนี้ช่วยลดต้นทุนในขณะที่เพิ่มประสิทธิภาพ ซึ่งอาจดึงดูดนักพัฒนาที่ลังเลที่จะสร้างบนโครงสร้างพื้นฐานแบบกระจายศูนย์เนื่องจากการแลกเปลี่ยนระหว่างราคาและประสิทธิภาพ
M3 ช่วยเพิ่มความสามารถในการปรับขนาดด้วยการจัดการคำขอต่อวินาทีมากขึ้นโดยใช้ทรัพยากรน้อยลง นั่นคือคำตอบโดยตรงสำหรับคอขวดที่ทำให้โครงการ AI จำนวนมากต้องพึ่งพาผู้ให้บริการคลาวด์แบบรวมศูนย์
ยังไม่มีวันวางจำหน่าย
MiniMax ยังไม่ได้ประกาศว่า M3 จะพร้อมใช้งานเมื่อใด บริษัทยังอยู่ในช่วงปล่อยทีเซอร์ โดยให้รายละเอียดทางเทคนิคเพียงเล็กน้อยนอกเหนือจากตัวเลขความเร็วในการทำความเข้าใจ นักพัฒนาและผู้ที่สนใจ AI แบบกระจายศูนย์จะต้องรอการวัดประสิทธิภาพหรือการเปิดตัวรุ่นเบต้าเพื่อดูว่าข้ออ้างดังกล่าวเป็นจริงหรือไม่




