Loading market data...

Anthropic chuyển sang biện pháp bảo vệ hiển thị cho Claude sau phản ứng dữ dội về Fable 5

Anthropic chuyển sang biện pháp bảo vệ hiển thị cho Claude sau phản ứng dữ dội về Fable 5

Anthropic đã đảo ngược quan điểm về các biện pháp bảo vệ hiệu suất ẩn cho Claude sau phản ứng dữ dội từ cộng đồng về sự cố 'Fable 5'. Công ty sẽ triển khai các biện pháp bảo vệ hiển thị thay vì giới hạn hiệu suất ẩn. Thay đổi này, được công bố hôm thứ Ba, sẽ làm tăng tình trạng gắn cờ nội dung dương tính giả trên toàn nền tảng.

Fable 5 làm dấy lên làn sóng phản đối từ người dùng

Sự cố 'Fable 5' tuần trước khiến Claude hạn chế phản hồi mà không có giải thích rõ ràng, gây khó chịu cho người dùng và nhà phát triển. Các thành viên cộng đồng tràn ngập mạng xã hội và diễn đàn với những lời phàn nàn về sự thiếu minh bạch. Họ cho rằng các giới hạn hiệu suất ẩn khiến không thể hiểu tại sao các truy vấn hợp lệ lại bị chặn. Phản ứng dữ dội gia tăng khi người dùng nhận ra họ không thể điều chỉnh cài đặt để vượt qua các hạn chế.

Từ những bức tường vô hình đến ranh giới hữu hình

Trước đây, Claude sử dụng các biện pháp bảo vệ hiệu suất ẩn hoạt động mà người dùng không thấy. Giờ đây, Anthropic thay thế chúng bằng các biện pháp bảo vệ hiển thị, ngay lập tức thông báo cho người dùng khi nội dung kích hoạt cờ. Công ty xác nhận sự thay đổi này trực tiếp đáp ứng yêu cầu của cộng đồng về sự rõ ràng. Người dùng sẽ thấy lý do cụ thể khiến tin nhắn bị gắn cờ, như 'phát hiện nội dung nhạy cảm' hoặc 'vượt quá ranh giới ngữ cảnh', thay vì lỗi chung chung.

Đánh đổi: Sẽ có nhiều dương tính giả hơn

Anthropic thừa nhận các biện pháp bảo vệ hiển thị sẽ gây ra nhiều trường hợp gắn cờ nội dung dương tính giả hơn. Điều đó có nghĩa là các tin nhắn vô hại — như thảo luận về sự kiện lịch sử hoặc chủ đề học thuật — có thể bị chặn thường xuyên hơn so với hệ thống ẩn. Công ty cho biết sự gia tăng này là hậu quả không thể tránh khỏi của tính minh bạch, mặc dù không định lượng mức tăng dự kiến. Các kỹ sư đang ưu tiên độ chính xác của biện pháp bảo vệ nhưng cảnh báo người dùng nên mong đợi sự gián đoạn thường xuyên hơn trong quá trình chuyển đổi.

Người dùng sẽ trải nghiệm điều gì

Các biện pháp bảo vệ hiển thị đang được triển khai ngay lập tức trên tất cả giao diện Claude. Người dùng giờ đây sẽ thấy thông báo bật lên rõ ràng giải thích lý do đầu vào của họ kích hoạt cờ, bao gồm các tham chiếu hướng dẫn cụ thể. Trong khi một số người hoan nghênh sự minh bạch, những người khác ngay lập tức báo cáo sự bực bội nhỏ với các tin nhắn hợp lệ bị gắn cờ. Công ty chưa cam kết giảm dương tính giả nhưng cho biết đang thu thập phản hồi từ người dùng để tinh chỉnh hệ thống.

Nhóm kỹ thuật của Anthropic đang giám sát dữ liệu triển khai ban đầu khi người dùng lần đầu tiên gặp các cờ hiển thị mới.