تحقیق Lenz Research: مدل‌های هوش مصنوعی برای بررسی واقعیت در ۶۷٪ موارد با هم اختلاف دارند

یک مطالعه جدید از Lenz Research نشان داده است که مدل‌های هوش مصنوعی در ۶۷٪ از ادعاهای راستی‌آزمایی با یکدیگر اختلاف نظر دارند که این امر به قابلیت اطمینان سیستم‌های تأیید خودکار تردید ایجاد می‌کند. یافته‌های این تحقیق که بدون اعلام قبلی منتشر شده است، نشان می‌دهد که حتی ابزارهای پیشرفته هوش مصنوعی نیز هنگام تعیین حقیقت، مکرراً با یکدیگر تناقض دارند. محققان پشت این مطالعه بر نیاز به منابع متنوع و نظارت انسانی در تصمیم‌گیری، به ویژه در حوزه‌های پرشتاب مانند بازارهای مالی، تأکید می‌کنند.

دامنه اختلاف نظر

رقم ۶۷٪ قابل توجه است. این بدان معناست که از هر سه ادعای راستی‌آزمایی که توسط مدل‌های مختلف هوش مصنوعی پردازش می‌شوند، دو مورد به نتایج متناقض می‌رسند. Lenz Research مشخص نکرده است که کدام مدل‌ها یا ماهیت ادعاها چه بوده است، اما مفهوم آن روشن است: هیچ سیستم هوش مصنوعی واحدی را نمی‌توان به تنهایی برای تشخیص حقیقت از داستان‌سازی قابل اعتماد دانست. نرخ اختلاف نظر به تفاوت‌های اساسی در نحوه آموزش مدل‌ها، داده‌هایی که از آن استخراج می‌کنند و منطق زیربنایی آن‌ها اشاره دارد.

در بازارهای پرنوسان، جایی که شایعات می‌توانند در عرض چند ثانیه قیمت‌ها را تغییر دهند، ریسک بالاست. یک معامله‌گر که به یک بررسی‌کننده واقعیت مبتنی بر هوش مصنوعی اعتماد می‌کند، ممکن است بر اساس برچسبی اقدام کند که مدل دیگری آن را رد می‌کند. نویسندگان این مطالعه به صراحت به «بازارهای پرنوسان» به عنوان زمینه‌ای اشاره می‌کنند که تنوع منابع و قضاوت انسانی حیاتی می‌شود. ابزارهای خودکار می‌توانند حجم زیادی از داده‌ها را پردازش کنند، اما بدون دخالت انسان نمی‌توانند تناقضات خود را حل کنند.

نتیجه تحقیق

توصیه Lenz Research واضح است: به یک منبع هوش مصنوعی واحد تکیه نکنید. در عوض، خروجی‌ها را متقاطع کنترل کنید، بازبینان انسانی را وارد کنید و بررسی‌های واقعیت خودکار را به عنوان یکی از ورودی‌های متعدد در نظر بگیرید. این فراخوانی برای کنار گذاشتن فناوری نیست، بلکه هشداری علیه اعتماد به نفس بیش از حد است. این مطالعه راه حلی برای مشکل اختلاف نظر ارائه نمی‌دهد، اما استدلال قوی برای دخیل نگه داشتن افراد دارد.

این یافته‌ها به شواهد رو به رشدی اضافه می‌کند که نشان می‌دهد هوش مصنوعی، با وجود سرعت بالا، همچنان در زمینه سازگاری با مشکل مواجه است. Lenz Research اعلام نکرده است که آیا قصد دارد با تحلیل عمیق‌تری از دلایل اختلاف نظر مدل‌ها یا راه‌های هماهنگ‌سازی آن‌ها ادامه دهد یا خیر. فعلاً پیام ساده است: وقتی ماشین‌ها نمی‌توانند توافق کنند، تصمیم‌گیری بر عهده انسان‌هاست.

دامنه اختلاف نظر

نتیجه تحقیق

Related Articles