یک مطالعه جدید از Lenz Research نشان داده است که مدلهای هوش مصنوعی در ۶۷٪ از ادعاهای راستیآزمایی با یکدیگر اختلاف نظر دارند که این امر به قابلیت اطمینان سیستمهای تأیید خودکار تردید ایجاد میکند. یافتههای این تحقیق که بدون اعلام قبلی منتشر شده است، نشان میدهد که حتی ابزارهای پیشرفته هوش مصنوعی نیز هنگام تعیین حقیقت، مکرراً با یکدیگر تناقض دارند. محققان پشت این مطالعه بر نیاز به منابع متنوع و نظارت انسانی در تصمیمگیری، به ویژه در حوزههای پرشتاب مانند بازارهای مالی، تأکید میکنند.
دامنه اختلاف نظر
رقم ۶۷٪ قابل توجه است. این بدان معناست که از هر سه ادعای راستیآزمایی که توسط مدلهای مختلف هوش مصنوعی پردازش میشوند، دو مورد به نتایج متناقض میرسند. Lenz Research مشخص نکرده است که کدام مدلها یا ماهیت ادعاها چه بوده است، اما مفهوم آن روشن است: هیچ سیستم هوش مصنوعی واحدی را نمیتوان به تنهایی برای تشخیص حقیقت از داستانسازی قابل اعتماد دانست. نرخ اختلاف نظر به تفاوتهای اساسی در نحوه آموزش مدلها، دادههایی که از آن استخراج میکنند و منطق زیربنایی آنها اشاره دارد.
در بازارهای پرنوسان، جایی که شایعات میتوانند در عرض چند ثانیه قیمتها را تغییر دهند، ریسک بالاست. یک معاملهگر که به یک بررسیکننده واقعیت مبتنی بر هوش مصنوعی اعتماد میکند، ممکن است بر اساس برچسبی اقدام کند که مدل دیگری آن را رد میکند. نویسندگان این مطالعه به صراحت به «بازارهای پرنوسان» به عنوان زمینهای اشاره میکنند که تنوع منابع و قضاوت انسانی حیاتی میشود. ابزارهای خودکار میتوانند حجم زیادی از دادهها را پردازش کنند، اما بدون دخالت انسان نمیتوانند تناقضات خود را حل کنند.
نتیجه تحقیق
توصیه Lenz Research واضح است: به یک منبع هوش مصنوعی واحد تکیه نکنید. در عوض، خروجیها را متقاطع کنترل کنید، بازبینان انسانی را وارد کنید و بررسیهای واقعیت خودکار را به عنوان یکی از ورودیهای متعدد در نظر بگیرید. این فراخوانی برای کنار گذاشتن فناوری نیست، بلکه هشداری علیه اعتماد به نفس بیش از حد است. این مطالعه راه حلی برای مشکل اختلاف نظر ارائه نمیدهد، اما استدلال قوی برای دخیل نگه داشتن افراد دارد.
این یافتهها به شواهد رو به رشدی اضافه میکند که نشان میدهد هوش مصنوعی، با وجود سرعت بالا، همچنان در زمینه سازگاری با مشکل مواجه است. Lenz Research اعلام نکرده است که آیا قصد دارد با تحلیل عمیقتری از دلایل اختلاف نظر مدلها یا راههای هماهنگسازی آنها ادامه دهد یا خیر. فعلاً پیام ساده است: وقتی ماشینها نمیتوانند توافق کنند، تصمیمگیری بر عهده انسانهاست.



