Anthropic Lancarkan Claude Fable 5, Dakwa Prestasi Terbaik pada Separuh Harga Model Sebelumnya

Anthropic melancarkan Claude Fable 5 pada hari Selasa, model AI guna umum terkini dan sistem awam paling berupaya syarakat setakat ini. Model kelas Mythos ini mengalahkan pesaing dalam penanda aras pengekodan, kewangan, dan penglihatan, menurut ujian dalaman. Harga ditetapkan kurang daripada separuh kos Claude Mythos Preview milik Anthropic sendiri, satu langkah yang boleh menggegarkan pasaran model bahasa besar yang sesak.

Apa yang dibawa oleh Claude Fable 5

Fable 5 dibina di atas seni bina Mythos, keluarga yang sama dengan Mythos Preview terdahulu. Namun Anthropic mengatakan versi ini mendorong prestasi lebih jauh dalam beberapa domain utama. Dalam tugas pengekodan, ia mengatasi model setanding daripada OpenAI, Google, dan Meta, lapor syarikat. Penanda aras analisis kewangan juga menunjukkan kelebihan, dan tugas berasaskan penglihatan — seperti mentafsir carta dan graf — mendapat skor lebih tinggi daripada keluaran Anthropic sebelumnya dan sistem pesaing.

Model ini mula tersedia pada hari Selasa melalui API Anthropic dan chatbot penggunanya, Claude. Pengguna boleh mengaksesnya dengan segera, walaupun syarikat tidak mendedahkan had penggunaan atau had kadar tertentu untuk pelancaran ini.

Potongan harga mengubah kiraan

Perkara yang paling menarik dalam pengumuman Selasa ini adalah harga. Claude Fable 5 berharga kurang daripada separuh kos yang dikenakan Claude Mythos Preview setiap token. Anthropic tidak mengeluarkan angka tepat setiap token dalam bahan pelancaran, tetapi diskaun itu cukup signifikan sehingga syarikat merangkanya sebagai kelebihan strategik. Bagi pembangun dan perniagaan yang menjalankan jumlah pertanyaan yang besar, penjimatan boleh menjadi besar.

Harga yang lebih rendah juga memberi tekanan kepada pesaing. GPT-4o OpenAI dan Gemini 1.5 Pro Google membawa kos setiap token yang serupa dengan Mythos Preview yang lebih lama, bermakna Fable 5 mengalahkan mereka pada harga sambil mendakwa prestasi unggul pada penanda aras tertentu. Sama ada beban kerja dunia sebenar sepadan dengan ujian dalaman masih belum diketahui, tetapi harga itu sendiri berkemungkinan menarik perhatian pembeli perusahaan.

Tuntutan penanda aras vs. persaingan sebenar

Anthropic menyediakan perbandingan pada tiga kategori penanda aras: pengekodan (menggunakan HumanEval, SWE-bench, dan penilaian dalaman), kewangan (gabungan tugas penaakulan kewangan dan rumusan), dan penglihatan (kapsyen imej dan QA visual). Dalam setiap kategori, Fable 5 mendapat skor lebih tinggi daripada GPT-4o, Gemini 1.5 Pro, dan Llama 3.1 405B Meta, menurut data Anthropic.

Pengesahan bebas belum diterbitkan lagi. Keputusan penanda aras daripada syarikat yang membina model adalah standard dalam industri, tetapi audit pihak ketiga — seperti yang dijalankan oleh HELM Stanford atau LMSYS Chatbot Arena — sering lebih dipercayai oleh pembangun yang skeptikal. Anthropic tidak menyatakan bila atau sama ada ia akan menghantar Fable 5 untuk penilaian tersebut.

Model ini juga menyokong input multimodal, bermakna pengguna boleh memuat naik imej bersama teks. Ciri itu tidak tersedia dalam keluaran Mythos Preview, yang hanya teks. Anthropic mengatakan prestasi penglihatan pada Fable 5 melebihi model penglihatan khusus daripada makmal lain pada tugas yang diuji.

Apa yang akan datang

Anthropic belum mengumumkan garis masa untuk menggantikan tier Mythos Preview yang lebih lama. Buat masa ini kedua-dua model masih tersedia, tetapi jurang harga yang curam dan keuntungan prestasi menjadikan Fable 5 pilihan yang jelas untuk projek baharu. Pengguna sedia ada pada Mythos Preview mungkin ingin menguji Fable 5 dan membandingkan keputusan sebelum memindahkan beban kerja pengeluaran.

Pelancaran ini tiba ketika perlumbaan senjata AI memasuki fasa baharu — bukan hanya tentang keupayaan mentah, tetapi tentang kemampuan pada skala besar. Pertaruhan Anthropic adalah bahawa model yang lebih murah dan lebih kuat akan menarik pelanggan yang teragak-agak dengan harga sebelumnya. Sama ada pertaruhan itu berbaloi bergantung pada prestasi Fable 5 di luar makmal, dalam dunia aplikasi sebenar yang kucar-kacir dan tidak dapat diramalkan.

Apa yang dibawa oleh Claude Fable 5

Potongan harga mengubah kiraan

Tuntutan penanda aras vs. persaingan sebenar

Apa yang akan datang

Related Articles