StepFun, lab yang berbasis di Shanghai yang dikenal sebagai pengembang model bahasa besar berperforma tinggi, telah mengembangkan AI suara yang mengungguli semua tolok ukur yang ada. Sistem ini juga mampu mendeteksi isyarat emosional halus seperti desahan, menurut rincian yang dirilis oleh lab tersebut.
Bagaimana sistem diuji
StepFun tidak menyebutkan tolok ukur mana yang digunakan atau mengungkapkan skor pasti, tetapi mengklaim model tersebut mengalahkan semua pesaing dalam serangkaian evaluasi AI suara standar. Lab sebelumnya telah menerbitkan LLM sumber terbuka yang menempati peringkat teratas dalam papan peringkat untuk tugas bahasa Mandarin dan Inggris.
Apa arti deteksi emosional
Di luar pengenalan dan sintesis suara, model baru ini dapat menangkap sinyal non-verbal seperti desahan—indikator frustrasi, kelegaan, atau kelelahan. Tingkat nuansa tersebut dapat membuat AI berguna dalam layanan pelanggan, skrining kesehatan mental, atau asisten dalam mobil, meskipun StepFun belum mengumumkan kemitraan atau penerapan komersial apa pun.
Lab AI China telah bersaing secara agresif dengan rekan-rekan AS dalam tugas teks dan suara. Klaim StepFun tentang model suara peringkat teratas menambah tekanan pada pesaing seperti Baidu, Alibaba, dan SenseTime, yang juga menjalankan program penelitian AI suara. Lab belum membagikan apakah model tersebut akan dirilis sebagai sumber terbuka atau disimpan sebagai produk berpemilik.
Lab menolak berkomentar tentang data pelatihan, ukuran model, atau komputasi yang digunakan untuk mencapai hasil tersebut. Kurangnya detail tersebut umum terjadi di bidang ini, di mana klaim kinerja sering kali melampaui verifikasi yang ditinjau oleh rekan sejawat.
Pertanyaan yang belum terjawab tentang penerapan
StepFun belum mengumumkan jadwal untuk mengintegrasikan AI suara ke dalam aplikasi atau platform apa pun. Lab hanya mengatakan akan menerbitkan makalah teknis dan mungkin merilis kode sampel dalam beberapa bulan mendatang. Apakah teknologi tersebut akan dilisensikan kepada pihak ketiga atau dibangun ke dalam produk yang menghadap konsumen masih belum diketahui.



