Loading market data...

مختبر شنغهاي StepFun يبني نظام ذكاء صوتي يتفوق على جميع المعايير ويكشف عن التنهدات

مختبر شنغهاي StepFun يبني نظام ذكاء صوتي يتفوق على جميع المعايير ويكشف عن التنهدات

طور مختبر StepFun، ومقره شنغهاي والمعروف ببناء نماذج لغوية كبيرة عالية الأداء، نظام ذكاء صوتي يتفوق على جميع المعايير الحالية. كما أن النظام قادر أيضًا على اكتشاف الإشارات العاطفية الدقيقة مثل التنهدات، وفقًا للتفاصيل التي نشرها المختبر.

كيف تم اختبار النظام

لم يحدد StepFun المعايير المستخدمة أو يكشف عن النتائج الدقيقة، لكنه ادعى أن النموذج تفوق على جميع المنافسين عبر مجموعة قياسية من تقييمات الذكاء الصوتي. وقد نشر المختبر سابقًا نماذج لغوية كبيرة مفتوحة المصدر حلت في المراتب العليا في لوحات المتصدرين لمهام اللغة الصينية والإنجليزية.

ماذا يعني اكتشاف المشاعر

إلى جانب التعرف على الكلام وتوليفه، يمكن للنموذج الجديد التقاط الإشارات غير اللفظية مثل التنهدات - وهي مؤشر على الإحباط أو الارتياح أو الإرهاق. هذا المستوى من الدقة قد يجعل الذكاء الاصطناعي مفيدًا في خدمة العملاء، أو فحص الصحة النفسية، أو المساعدين داخل السيارة، على الرغم من أن StepFun لم يعلن عن أي شراكات تجارية أو عمليات نشر.

تتنافس مختبرات الذكاء الاصطناعي الصينية بقوة مع نظيراتها الأمريكية في مهام النص والصوت على حد سواء. ادعاء StepFun بوجود نموذج صوتي في المرتبة الأولى يضيف ضغطًا على المنافسين مثل Baidu وAlibaba وSenseTime، التي تدير أيضًا برامج بحثية في الذكاء الصوتي. لم يشارك المختبر ما إذا كان سيتم إصدار النموذج كمصدر مفتوح أو الاحتفاظ به كمنتج مملوك.

رفض المختبر التعليق على بيانات التدريب أو حجم النموذج أو الحوسبة المستخدمة لتحقيق النتائج. هذا النقص في التفاصيل شائع في هذا المجال، حيث غالبًا ما تسبق ادعاءات الأداء التحقق من قبل الأقران.

أسئلة غير مجابة حول النشر

لم يعلن StepFun عن جدول زمني لدمج الذكاء الصوتي في أي تطبيق أو منصة. قال المختبر فقط إنه سينشر ورقة فنية وربما يطلق عينة من الكود في الأشهر القادمة. لا يزال من غير المعروف ما إذا كانت التقنية سيتم ترخيصها لأطراف ثالثة أو بناؤها في منتج موجه للمستهلكين.