Loading market data...

Makmal Shanghai StepFun Bina AI Suara Yang Mengatasi Setiap Penanda Aras, Mengesan Keluhan

Makmal Shanghai StepFun Bina AI Suara Yang Mengatasi Setiap Penanda Aras, Mengesan Keluhan

StepFun, makmal yang berpangkalan di Shanghai yang terkenal dengan membina model bahasa besar berprestasi tinggi, telah membangunkan AI suara yang mengatasi setiap penanda aras sedia ada. Sistem ini juga mampu mengesan isyarat emosi halus seperti keluhan, menurut butiran yang dikeluarkan oleh makmal tersebut.

Bagaimana sistem diuji

StepFun tidak menyatakan penanda aras mana yang digunakan atau mendedahkan skor tepat, tetapi mendakwa model itu mengalahkan semua pesaing dalam set penilaian AI suara standard. Makmal sebelum ini telah menerbitkan LLM sumber terbuka yang berada di kedudukan teratas papan pendahulu untuk tugas bahasa Cina dan Inggeris.

Apa maksud pengesanan emosi

Di luar pengecaman dan sintesis pertuturan, model baharu ini boleh menangkap isyarat bukan lisan seperti keluhan—petunjuk kekecewaan, kelegaan, atau keletihan. Tahap nuansa itu boleh menjadikan AI berguna dalam perkhidmatan pelanggan, saringan kesihatan mental, atau pembantu dalam kereta, walaupun StepFun belum mengumumkan sebarang perkongsian atau penggunaan komersial.

Makmal AI China telah bersaing secara agresif dengan rakan sejawat AS dalam kedua-dua tugas teks dan suara. Tuntutan StepFun tentang model suara bertaraf teratas menambah tekanan kepada pesaing seperti Baidu, Alibaba, dan SenseTime, yang juga menjalankan program penyelidikan AI suara. Makmal tidak berkongsi sama ada model itu akan dikeluarkan sebagai sumber terbuka atau disimpan sebagai produk proprietari.

Makmal enggan mengulas tentang data latihan, saiz model, atau pengiraan yang digunakan untuk mencapai keputusan tersebut. Kekurangan butiran itu adalah biasa dalam bidang ini, di mana tuntutan prestasi sering mendahului pengesahan semakan rakan sebaya.

Soalan yang belum terjawab tentang penggunaan

StepFun belum mengumumkan garis masa untuk mengintegrasikan AI suara ke dalam mana-mana aplikasi atau platform. Makmal hanya berkata bahawa ia akan menerbitkan kertas teknikal dan mungkin mengeluarkan kod sampel dalam beberapa bulan akan datang. Sama ada teknologi itu akan dilesenkan kepada pihak ketiga atau dibina menjadi produk yang menghadap pengguna masih tidak diketahui.