Loading market data...

تغییر رویه Anthropic به سمت محافظ‌های قابل مشاهده برای Claude پس از واکنش به Fable 5

تغییر رویه Anthropic به سمت محافظ‌های قابل مشاهده برای Claude پس از واکنش به Fable 5

شرکت Anthropic پس از واکنش شدید جامعه به حادثهٔ «Fable 5»، موضع خود را در مورد محافظ‌های نامرئی عملکرد Claude تغییر داد. این شرکت اکنون به جای محدودیت‌های پنهان عملکرد، محافظ‌های قابل مشاهده را پیاده‌سازی خواهد کرد. این تغییر که روز سه‌شنبه اعلام شد، باعث افزایش پرچم‌گذاری محتوای مثبت کاذب در سراسر پلتفرم خواهد شد.

Fable 5 خشم کاربران را برمی‌انگیزد

در حادثهٔ هفتهٔ گذشته «Fable 5»، Claude پاسخ‌ها را بدون توضیح واضح محدود کرد که باعث ناامیدی کاربران و توسعه‌دهندگان شد. اعضای جامعه شبکه‌های اجتماعی و انجمن‌ها را با شکایت از عدم شفافیت پر کردند. آنها استدلال کردند که محدودیت‌های پنهان عملکرد باعث می‌شود نتوان فهمید چرا پرس‌وجوهای قانونی مسدود می‌شوند. این واکنش زمانی شدت گرفت که کاربران متوجه شدند نمی‌توانند تنظیمات را برای دور زدن محدودیت‌ها تغییر دهند.

از دیوارهای نامرئی تا مرزهای قابل مشاهده

پیش از این، Claude از محافظ‌های پنهان عملکرد استفاده می‌کرد که بدون دید کاربر عمل می‌کردند. اکنون Anthropic آن‌ها را با محافظ‌های قابل مشاهده جایگزین می‌کند که بلافاصله به کاربر اطلاع می‌دهند چه زمانی محتوا باعث پرچم‌گذاری می‌شود. این شرکت تأیید کرد که این تغییر مستقیماً در پاسخ به درخواست جامعه برای شفافیت است. کاربران به جای خطاهای عمومی، دلایل خاص پرچم‌گذاری پیام‌ها را مشاهده خواهند کرد، مانند «محتوای حساس شناسایی شد» یا «مرزهای زمینه‌ای فراتر رفت».

مبادله: مثبت کاذب بیشتر در پیش است

Anthropic اذعان می‌کند که محافظ‌های قابل مشاهده باعث پرچم‌گذاری مثبت کاذب بیشتری خواهند شد. این بدان معناست که پیام‌های بی‌ضرر - مانند بحث در مورد رویدادهای تاریخی یا موضوعات آکادمیک - ممکن است بیشتر از سیستم پنهان مسدود شوند. این شرکت اعلام کرد این افزایش پیامد اجتناب‌ناپذیر شفافیت است، هرچند میزان افزایش مورد انتظار را کمّی‌سازی نکرد. مهندسان در حال اولویت‌بندی دقت محافظ‌ها هستند اما به کاربران هشدار دادند که در طول انتقال باید انتظار وقفه‌های مکرر را داشته باشند.

آنچه کاربران تجربه خواهند کرد

محافظ‌های قابل مشاهده بلافاصله در تمام رابط‌های Claude در حال عرضه هستند. کاربران اکنون اعلان‌های پاپ‌آپ واضحی خواهند دید که دلیل پرچم‌گذاری ورودی آن‌ها را توضیح می‌دهد، از جمله ارجاع به دستورالعمل‌های خاص. در حالی که برخی از شفافیت استقبال کردند، دیگران بلافاصله ناراحتی‌های جزئی ناشی از پرچم‌گذاری پیام‌های قانونی را گزارش کردند. این شرکت متعهد به کاهش مثبت کاذب نشده اما گفته است که برای بهبود سیستم بازخورد کاربران را جمع‌آوری می‌کند.

تیم مهندسی Anthropic داده‌های اولیه عرضه را زیر نظر دارد زیرا کاربران برای اولین بار با پرچم‌های جدید قابل مشاهده مواجه می‌شوند.