Anthropic Beralih ke Pengamanan Terlihat untuk Claude Setelah Kecaman Fable 5

Anthropic membalikkan sikapnya terhadap pengamanan kinerja tersembunyi untuk Claude setelah kecaman komunitas terkait insiden 'Fable 5'. Perusahaan kini akan menerapkan pengamanan terlihat sebagai ganti batasan kinerja tersembunyi. Perubahan yang diumumkan pada hari Selasa ini akan meningkatkan penandaan konten positif palsu di seluruh platform.

Fable 5 Memicu Kemarahan Pengguna

Insiden 'Fable 5' pekan lalu membuat Claude membatasi respons tanpa penjelasan yang jelas, membuat frustrasi pengguna dan pengembang. Anggota komunitas membanjiri media sosial dan forum dengan keluhan tentang kurangnya transparansi. Mereka berpendapat batasan kinerja tersembunyi membuat tidak mungkin untuk memahami mengapa pertanyaan yang sah diblokir. Kecaman semakin intens ketika pengguna menyadari mereka tidak dapat menyesuaikan pengaturan untuk melewati pembatasan tersebut.

Dari Dinding Tak Terlihat ke Batas Terlihat

Sebelumnya, Claude menggunakan pengamanan kinerja tersembunyi yang beroperasi tanpa visibilitas pengguna. Sekarang Anthropic menggantinya dengan pengamanan terlihat yang segera memberi tahu pengguna ketika konten memicu bendera. Perusahaan mengonfirmasi pergeseran ini secara langsung merespons tuntutan komunitas akan kejelasan. Pengguna akan melihat alasan spesifik mengapa pesan ditandai, seperti 'konten sensitif terdeteksi' atau 'batas konteks terlampaui', bukan kesalahan umum.

Tukar Tambah: Lebih Banyak Positif Palsu di Depan

Anthropic mengakui pengamanan terlihat akan menyebabkan lebih banyak penandaan konten positif palsu. Itu berarti pesan yang tidak berbahaya—seperti membahas peristiwa sejarah atau topik akademis—mungkin lebih sering diblokir daripada di bawah sistem tersembunyi. Perusahaan menyatakan peningkatan ini adalah konsekuensi yang tidak terhindarkan dari transparansi, meskipun tidak mengukur perkiraan kenaikannya. Para insinyur memprioritaskan akurasi pengamanan tetapi memperingatkan pengguna untuk mengharapkan gangguan yang lebih sering selama masa transisi.

Apa yang Akan Dialami Pengguna

Pengamanan terlihat mulai diterapkan segera di semua antarmuka Claude. Pengguna sekarang akan melihat pemberitahuan pop-up yang jelas menjelaskan mengapa input mereka memicu bendera, termasuk referensi pedoman spesifik. Sementara beberapa menyambut transparansi, yang lain segera melaporkan frustrasi kecil dengan pesan sah yang ditandai. Perusahaan belum berkomitmen untuk mengurangi positif palsu tetapi mengatakan sedang mengumpulkan umpan balik pengguna untuk menyempurnakan sistem.

Tim teknik Anthropic memantau data peluncuran awal saat pengguna menghadapi bendera terlihat baru untuk pertama kalinya.

Fable 5 Memicu Kemarahan Pengguna

Dari Dinding Tak Terlihat ke Batas Terlihat

Tukar Tambah: Lebih Banyak Positif Palsu di Depan

Apa yang Akan Dialami Pengguna

Related Articles