MiniMax paralajmëron modelin M3 të AI me shpejtësi dekodimi 15.6 herë më të shpejtë për AI të decentralizuar

MiniMax paralajmëroi modelin e tij të ardhshëm M3, duke premtuar një përmirësim 15.6 herë më të madh në shpejtësinë e kuptimit. Kompania thotë se modeli është ndërtuar për të riformësuar AI të decentralizuar duke ulur vonesën dhe kostot.

Çfarë nënkupton përmirësimi i shpejtësisë

Shpejtësia e kuptimit është koha që AI merr për të gjeneruar output nga input. Një përmirësim 15.6 herë më i madh do të thotë se detyrat që dikur zgjasnin sekonda mund të ndodhin në milisekonda. Për AI të decentralizuar—ku përpunimi ndodh nëpër nyje të shpërndara në vend të serverëve të centralizuar—kjo ka rëndësi të madhe. Vonesa më e ulët bën aplikacionet në kohë reale si asistentët zanorë ose përkthimi i drejtpërdrejtë më të realizueshëm në rrjete të decentralizuara.

Fokus në kosto dhe shkallëzim

MiniMax po e pozicionon M3 si një zgjidhje për dy probleme të vazhdueshme në AI të decentralizuar: kostot e larta të llogaritjes dhe shkallëzimi i kufizuar. Kompania pretendon se modeli ul kostot duke rritur efikasitetin. Kjo mund të tërheqë zhvillues që kanë hezituar të ndërtojnë në infrastrukturë të decentralizuar për shkak të kompromiseve midis çmimit dhe performancës.

M3 përmirëson shkallëzimin duke trajtuar më shumë kërkesa për sekondë me më pak burime. Kjo është një përgjigje direkte ndaj ngushticës që mban shumë projekte AI të lidhura me ofruesit e centralizuar të cloud.

Ende nuk ka datë lëshimi

MiniMax nuk ka njoftuar kur M3 do të jetë i disponueshëm. Kompania është ende në fazën e paralajmërimeve, duke ofruar pak detaje teknike përtej shifrës së shpejtësisë së kuptimit. Zhvilluesit dhe entuziastët e AI të decentralizuar do të duhet të presin për benchmark-e ose një version beta për të parë nëse pretendimet qëndrojnë.

Çfarë nënkupton përmirësimi i shpejtësisë

Fokus në kosto dhe shkallëzim

Ende nuk ka datë lëshimi

Related Articles