Anthropic เปิดตัว Claude Fable 5 เมื่อวันอังคาร ซึ่งเป็นโมเดล AI เพื่อการใช้งานทั่วไปรุ่นล่าสุด และเป็นระบบที่เปิดให้สาธารณชนใช้งานได้ที่มีความสามารถมากที่สุดของบริษัทจนถึงปัจจุบัน โมเดลระดับ Mythos นี้มีประสิทธิภาพเหนือกว่าคู่แข่งในเกณฑ์วัดการเขียนโค้ด การเงิน และวิทัศน์ ตามการทดสอบภายใน โดยราคาถูกกำหนดไว้ต่ำกว่าครึ่งหนึ่งของราคา Claude Mythos Preview ของ Anthropic เอง ซึ่งเป็นการเคลื่อนไหวที่อาจส่งผลกระทบต่อตลาดโมเดลภาษาขนาดใหญ่ที่แข่งขันกันอย่างดุเดือด
สิ่งที่ Claude Fable 5 นำมาใหม่
Fable 5 สร้างขึ้นบนสถาปัตยกรรม Mythos ซึ่งเป็นตระกูลเดียวกับ Mythos Preview รุ่นก่อนหน้า แต่ Anthropic กล่าวว่ารุ่นนี้สามารถเพิ่มประสิทธิภาพการทำงานได้มากขึ้นในหลายโดเมนที่สำคัญ ในงานเขียนโค้ด โมเดลนี้มีประสิทธิภาพเหนือกว่าโมเดลเทียบเคียงจาก OpenAI, Google และ Meta ตามรายงานของบริษัท เกณฑ์วัดการวิเคราะห์ทางการเงินก็แสดงให้เห็นถึงความเป็นผู้นำเช่นกัน ส่วนงานที่เกี่ยวข้องกับวิทัศน์ เช่น การตีความแผนภูมิและกราฟ มีคะแนนสูงกว่ารุ่นก่อนหน้าของ Anthropic และระบบของคู่แข่ง
โมเดลนี้เปิดให้ใช้งานตั้งแต่วันอังคารผ่าน API ของ Anthropic และแชทบอตสำหรับผู้บริโภคอย่าง Claude ผู้ใช้สามารถเข้าถึงได้ทันที แม้ว่าบริษัทจะยังไม่ได้เปิดเผยขีดจำกัดการใช้งานหรืออัตราการจำกัดคำขอที่เฉพาะเจาะจงสำหรับการเปิดตัวครั้งนี้
การลดราคาเปลี่ยนสมการ
รายละเอียดที่โดดเด่นที่สุดในประกาศเมื่อวันอังคารคือราคา Claude Fable 5 มีต้นทุนต่ำกว่าครึ่งหนึ่งของราคาต่อโทเค็นที่ Claude Mythos Preview คิดเรียกเก็บ Anthropic ไม่ได้เปิดเผยตัวเลขต่อโทเค็นที่แน่นอนในเอกสารเปิดตัว แต่ส่วนลดนั้นมีนัยสำคัญพอที่บริษัทจะนำเสนอเป็นข้อได้เปรียบเชิงกลยุทธ์ สำหรับนักพัฒนาและธุรกิจที่เรียกใช้ข้อสอบถามจำนวนมาก การประหยัดต้นทุนอาจมีจำนวนมาก
ราคาที่ต่ำลงยังสร้างแรงกดดันต่อคู่แข่ง GPT-4o ของ OpenAI และ Gemini 1.5 Pro ของ Google มีต้นทุนต่อโทเค็นใกล้เคียงกับ Mythos Preview รุ่นเก่า ซึ่งหมายความว่า Fable 5 ตัดราคาพวกเขาในขณะที่อ้างประสิทธิภาพที่เหนือกว่าในเกณฑ์วัดบางอย่าง ว่าจะตรงกับการทำงานในโลกจริงหรือไม่นั้นยังต้องรอดู แต่ราคาเพียงอย่างเดียวก็น่าจะดึงดูดความสนใจจากผู้ซื้อในองค์กร
ข้ออ้างด้านเกณฑ์วัดเทียบกับการแข่งขันจริง
Anthropic ให้การเปรียบเทียบในเกณฑ์วัดสามประเภท: การเขียนโค้ด (ใช้ HumanEval, SWE-bench และการประเมินภายใน), การเงิน (งานด้านการใช้เหตุผลทางการเงินและการสรุปความแบบผสมผสาน) และวิทัศน์ (การบรรยายภาพและการตอบคำถามเชิงภาพ) จากข้อมูลของ Anthropic ในแต่ละประเภท Fable 5 ได้คะแนนสูงกว่า GPT-4o, Gemini 1.5 Pro และ Llama 3.1 405B ของ Meta
ยังไม่มีการเผยแพร่การตรวจสอบอิสระ ผลลัพธ์เกณฑ์วัดจากบริษัทที่สร้างโมเดลนั้นเป็นมาตรฐานในอุตสาหกรรม แต่การตรวจสอบจากบุคคลที่สาม เช่น ที่ดำเนินการโดย HELM ของ Stanford หรือ LMSYS Chatbot Arena มักจะได้รับความเชื่อถือมากกว่าจากนักพัฒนาที่มีข้อกังขา Anthropic ไม่ได้ระบุว่าจะส่ง Fable 5 ไปประเมินเหล่านั้นเมื่อใดหรือว่าจะส่งหรือไม่
โมเดลนี้ยังรองรับอินพุตหลายรูปแบบ หมายความว่าผู้ใช้สามารถอัปโหลดรูปภาพควบคู่กับข้อความได้ คุณสมบัตินี้ไม่มีให้ในการเปิดตัว Mythos Preview ซึ่งเป็นแบบข้อความเท่านั้น Anthropic กล่าวว่าประสิทธิภาพด้านวิทัศน์บน Fable 5 นั้นเหนือกว่าโมเดลวิทัศน์เฉพาะจากห้องปฏิบัติการอื่นในงานที่ทดสอบ
อะไรจะเกิดขึ้นต่อไป
Anthropic ยังไม่ได้ประกาศไทม์ไลน์สำหรับการแทนที่รุ่น Mythos Preview รุ่นเก่า ในตอนนี้ทั้งสองรุ่นยังคงให้บริการอยู่ แต่ช่องว่างราคาที่มากและการปรับปรุงประสิทธิภาพทำให้ Fable 5 เป็นตัวเลือกที่ชัดเจนสำหรับโปรเจกต์ใหม่ ผู้ใช้ปัจจุบันที่ใช้ Mythos Preview อาจต้องการทดสอบ Fable 5 และเปรียบเทียบผลลัพธ์ก่อนย้ายเวิร์กโหลดในระบบผลิต
การเปิดตัวครั้งนี้เกิดขึ้นในช่วงที่การแข่งขันด้านอาวุธ AI เข้าสู่ระยะใหม่ ไม่ใช่แค่เรื่องความสามารถดิบ แต่ยังรวมถึงความสามารถในการเข้าถึงได้ในระดับขนาดใหญ่ การเดิมพันของ Anthropic คือโมเดลที่ถูกกว่าและแข็งแกร่งกว่าจะดึงดูดลูกค้าที่ลังเลกับราคาเดิม การเดิมพันนี้จะได้ผลหรือไม่นั้นขึ้นอยู่กับว่า Fable 5 จะทำงานนอกห้องปฏิบัติการในโลกแห่งความเป็นจริงที่ซับซ้อนและคาดเดาไม่ได้ได้อย่างไร




