Laboratori i Shanghais StepFun ndërton një AI të zërit që i mposht të gjitha referencat dhe zbulon vajtimet

StepFun, laboratori i bazuar në Shanghaj i njohur për ndërtimin e modeleve të mëdha gjuhësore me performancë të lartë, ka zhvilluar një AI të zërit që i mposht të gjitha referencat ekzistuese. Sistemi është gjithashtu i aftë të zbulojë ndikime emocionale të holla si vajtimet, sipas detajeve të publikuara nga laboratori.

Si u testua sistemi

StepFun nuk specifikoi cilat referenca u përdorën ose nuk zbuloi pikët e saktë, por deklaroi se modeli i mposhti të gjithë konkurrentët në një grup standard evaluimesh të AI-së së zërit. Laboratori më parë ka publikuar LLM-të të kodit të hapur që renditen afër kryes së tabelave të renditjes për detyrat gjuhësore kinezë dhe angleze.

Çfarë do të thotë zbulimi emocional

Përveç njohjes dhe sintezës së fjalës, modeli i ri mund të kapë sinjale jo-verbale si vajtimet—një tregues i frustrimit, qetësimit apo lodhjes. Kjo nivelë të detajuar mund të bëjë AI-në të dobishme në shërbimin e klientëve, skanimin e shëndetit mendor ose në ndihmësit e makinave, megjithëse StepFun nuk ka njoftuar asnjë partneritet komercial apo përdorim.

Laboratorët kinezë të AI-së po konkurrojnë me agresivitet me laboratorët amerikanë në detyra të fjalës dhe të zërit. Pretendimi i StepFun për një model zëri me renditje të lartë shtyn presionin ndaj konkurrentëve si Baidu, Alibaba dhe SenseTime, të cilët gjithashtu kryejnë programe kërkimore AI të zërit. Laboratori nuk ka ndarë nëse modeli do të lansohet si kod i hapur ose do të mbahet si produkt privat.

Laboratori refuzoi të komentojë mbi të dhënat e trajnimit, madhësinë e modelit ose komputimin e përdorur për të arritur rezultatet. Mungesa e këtyre detajeve është e zakonshme në fushë, ku pretendimet për performancë shpesh paraqiten para verifikimit nga bashkëkohësit.

Pyetje të papërgjigjura rreth implementimit

StepFun nuk ka njoftuar një kohëzgjatje për integrimin e AI-së së zërit në çdo aplikacion ose platformë. Laboratori tha vetëm se do të publikojë një dokument teknik dhe mund të lansojë kod shembull në muajt e ardhshëm. Nëse teknologjia do të licencohet për palë të treta ose do të integrohet në një produkt për konsumatorë mbetet e panjohur.

Si u testua sistemi

Çfarë do të thotë zbulimi emocional

Pyetje të papërgjigjura rreth implementimit

Related Articles