شرکت Anthropic پس از واکنش شدید جامعه به حادثهٔ «Fable 5»، موضع خود را در مورد محافظهای نامرئی عملکرد Claude تغییر داد. این شرکت اکنون به جای محدودیتهای پنهان عملکرد، محافظهای قابل مشاهده را پیادهسازی خواهد کرد. این تغییر که روز سهشنبه اعلام شد، باعث افزایش پرچمگذاری محتوای مثبت کاذب در سراسر پلتفرم خواهد شد.
Fable 5 خشم کاربران را برمیانگیزد
در حادثهٔ هفتهٔ گذشته «Fable 5»، Claude پاسخها را بدون توضیح واضح محدود کرد که باعث ناامیدی کاربران و توسعهدهندگان شد. اعضای جامعه شبکههای اجتماعی و انجمنها را با شکایت از عدم شفافیت پر کردند. آنها استدلال کردند که محدودیتهای پنهان عملکرد باعث میشود نتوان فهمید چرا پرسوجوهای قانونی مسدود میشوند. این واکنش زمانی شدت گرفت که کاربران متوجه شدند نمیتوانند تنظیمات را برای دور زدن محدودیتها تغییر دهند.
از دیوارهای نامرئی تا مرزهای قابل مشاهده
پیش از این، Claude از محافظهای پنهان عملکرد استفاده میکرد که بدون دید کاربر عمل میکردند. اکنون Anthropic آنها را با محافظهای قابل مشاهده جایگزین میکند که بلافاصله به کاربر اطلاع میدهند چه زمانی محتوا باعث پرچمگذاری میشود. این شرکت تأیید کرد که این تغییر مستقیماً در پاسخ به درخواست جامعه برای شفافیت است. کاربران به جای خطاهای عمومی، دلایل خاص پرچمگذاری پیامها را مشاهده خواهند کرد، مانند «محتوای حساس شناسایی شد» یا «مرزهای زمینهای فراتر رفت».
مبادله: مثبت کاذب بیشتر در پیش است
Anthropic اذعان میکند که محافظهای قابل مشاهده باعث پرچمگذاری مثبت کاذب بیشتری خواهند شد. این بدان معناست که پیامهای بیضرر - مانند بحث در مورد رویدادهای تاریخی یا موضوعات آکادمیک - ممکن است بیشتر از سیستم پنهان مسدود شوند. این شرکت اعلام کرد این افزایش پیامد اجتنابناپذیر شفافیت است، هرچند میزان افزایش مورد انتظار را کمّیسازی نکرد. مهندسان در حال اولویتبندی دقت محافظها هستند اما به کاربران هشدار دادند که در طول انتقال باید انتظار وقفههای مکرر را داشته باشند.
آنچه کاربران تجربه خواهند کرد
محافظهای قابل مشاهده بلافاصله در تمام رابطهای Claude در حال عرضه هستند. کاربران اکنون اعلانهای پاپآپ واضحی خواهند دید که دلیل پرچمگذاری ورودی آنها را توضیح میدهد، از جمله ارجاع به دستورالعملهای خاص. در حالی که برخی از شفافیت استقبال کردند، دیگران بلافاصله ناراحتیهای جزئی ناشی از پرچمگذاری پیامهای قانونی را گزارش کردند. این شرکت متعهد به کاهش مثبت کاذب نشده اما گفته است که برای بهبود سیستم بازخورد کاربران را جمعآوری میکند.
تیم مهندسی Anthropic دادههای اولیه عرضه را زیر نظر دارد زیرا کاربران برای اولین بار با پرچمهای جدید قابل مشاهده مواجه میشوند.



