یک تیم از محققان در چین مدل هوش مصنوعیای ساخته است که از زمان بیکاری خود برای آمادهسازی پاسخ به سوال بعدی کاربر قبل از پرسیدن آن استفاده میکند. این رویکرد میتواند تأخیر بین پرسشها را کاهش دهد و عوامل مکالمه را سریعتر و شهودیتر جلوه دهد.
تبدیل چرخههای بیکاری به شروعهای زودهنگام
بیشتر رباتهای گفتگوی هوش مصنوعی هر پرسش را به ترتیب پردازش میکنند. آنها گوش میدهند، محاسبه میکنند و سپس پاسخ میدهند. این باعث ایجاد شکافهایی در بین میشود که در آن هیچ کاری انجام نمیشود. محققان چینی مدلی طراحی کردهاند که این شکافها را با پیشبینی آنچه کاربر ممکن است بعدی بپرسد و پیشمحاسبه پاسخهای احتمالی پر میکند.
زمانی که هوش مصنوعی پاسخ به یک سوال را تمام میکند، به جای بیکار ماندن، شروع به اجرای سناریوهای ممکن برای سوال بعدی بر اساس زمینه گفتگو میکند. تا زمانی که کاربر پرسش بعدی را تایپ یا بیان کند، مدل بخشی از کار را انجام داده است. نتیجه کاهش قابل توجه زمان پاسخ است.
جزئیات در مورد معماری دقیق اندک است، اما محققان یافتههای خود را در یک پیشنشر به اشتراک گذاشتند. آنها مدل را در برابر رباتهای گفتگوی استاندارد آزمایش کردند و دریافتند که پیشمحاسبه تأخیر متوسط پاسخ را با حاشیه قابل توجهی کاهش میدهد. تیم مجموعه دادهها یا سختافزار خاص استفاده شده را فاش نکرد.
چگونه مدل حرکت بعدی را حدس میزند
سیستم فقط به صورت تصادفی حدس نمیزند. از تاریخچه گفتگو و آخرین پیام کاربر برای رتبهبندی دنبالههای احتمالی استفاده میکند. به عنوان مثال، اگر کسی درباره پیشبینی آب و هوا بپرسد، مدل ممکن است پاسخهایی را برای «فردا چطور؟» یا «آخر هفته باران میبارد؟» از پیش محاسبه کند.
این توانایی پیشبینی به یک شبکه عصبی سبک وزن متکی است که به صورت موازی با موتور اصلی چت اجرا میشود. محققان میگویند سربار کم است - محاسبه اضافی تنها کسری از منابعی را که مدل اصلی استفاده میکند مصرف میکند.
یک چالش: مدل فقط میتواند برای تعداد محدودی از گزینهها آماده شود. اگر کاربر چیزی کاملاً خارج از سناریو بپرسد، کار از پیش محاسبه شده هدر میرود. تیم در حال بررسی راههایی برای بهبود دقت پیشبینی بدون افزایش بیش از حد لیست گزینهها است.
این برای کمککنندههای روزمره هوش مصنوعی چه معنایی دارد
دستیاران مجازی، رباتهای خدمات مشتری و دستگاههای فعال شونده با صدا میتوانند از این رویکرد بهرهمند شوند. پاسخهای سریعتر تعاملات را طبیعیتر میکند، به ویژه زمانی که کاربران دنبالههای سریع میپرسند.
اما این ایده محدود به چت نیست. همین تکنیک میتواند برای تکمیل خودکار کد، تولید تصویر یا هر سیستم هوش مصنوعی که در آن کاربر مجموعهای از دستورات مرتبط را صادر میکند، اعمال شود.
پذیرش تجاری تضمین شده نیست. مدل باید بر روی لاگهای مکالمه بزرگ آموزش داده شود تا مدلهای پیشبینی قابل اعتماد بسازد. شرکتها همچنین باید هزینه محاسباتی اضافی را در مقابل صرفهجویی در تأخیر بسنجند.
محققان هیچ برنامهای برای انتشار عمومی مدل یا مشارکت با یک شرکت اعلام نکردهاند. آنها به کار بر روی بهبود الگوریتم پیشبینی و کاهش شروعهای نادرست ادامه میدهند.



