Loading market data...

Shanghai Lab StepFun bouwt spraak-AI die alle benchmarks overtreft en zuchten detecteert

Shanghai Lab StepFun bouwt spraak-AI die alle benchmarks overtreft en zuchten detecteert

StepFun, het in Shanghai gevestigde lab dat bekend staat om het bouwen van hoogpresterende grote taalmodellen, heeft een spraak-AI ontwikkeld die alle bestaande benchmarks overtreft. Het systeem is ook in staat om subtiele emotionele signalen zoals zuchten te detecteren, volgens door het lab vrijgegeven details.

Hoe het systeem werd getest

StepFun specificeerde niet welke benchmarks werden gebruikt of gaf exacte scores, maar beweerde dat het model alle concurrenten versloeg op een standaardset van spraak-AI-evaluaties. Het lab heeft eerder open-source LLM's gepubliceerd die hoog scoorden op leaderboards voor Chinese en Engelse taaltaken.

Wat de emotionele detectie betekent

Naast spraakherkenning en -synthese kan het nieuwe model non-verbale signalen zoals zuchten oppikken – een indicator van frustratie, opluchting of vermoeidheid. Dat niveau van nuance zou de AI nuttig kunnen maken in klantenservice, screening op geestelijke gezondheid of in-auto-assistenten, hoewel StepFun nog geen commerciële partnerschappen of implementaties heeft aangekondigd.

Chinese AI-labs concurreren agressief met hun Amerikaanse tegenhangers op zowel tekst- als spraaktaken. StepFuns claim van een toppositie voor spraakmodellen zet rivalen zoals Baidu, Alibaba en SenseTime, die ook spraak-AI-onderzoeksprogramma's draaien, onder druk. Het lab heeft niet gedeeld of het model als open source wordt vrijgegeven of als propriëtair product wordt behouden.

Het lab weigerde commentaar te geven op de trainingsdata, modelgrootte of rekenkracht die is gebruikt om de resultaten te bereiken. Dat gebrek aan detail is gebruikelijk in het veld, waar prestatieclaims vaak de verificatie door vakgenoten voorbijstreven.

Onbeantwoorde vragen over implementatie

StepFun heeft geen tijdlijn aangekondigd voor de integratie van de spraak-AI in een toepassing of platform. Het lab zei alleen dat het in de komende maanden een technisch artikel zal publiceren en mogelijk voorbeeldcode zal vrijgeven. Of de technologie in licentie zal worden gegeven aan derden of zal worden ingebouwd in een consumentgericht product, blijft onbekend.