Claude Fable 5 क्या लाता है
Fable 5 Mythos आर्किटेक्चर पर बनाया गया है, जो पिछले Mythos Preview के समान परिवार है। लेकिन Anthropic का कहना है कि यह संस्करण कई प्रमुख क्षेत्रों में प्रदर्शन को और आगे बढ़ाता है। कंपनी ने बताया कि कोडिंग कार्यों में यह OpenAI, Google और Meta के समान मॉडलों से बेहतर प्रदर्शन करता है। वित्तीय विश्लेषण बेंचमार्क में भी यह आगे है, और विज़न-आधारित कार्यों — जैसे चार्ट और आरेखों की व्याख्या — में पिछले Anthropic रिलीज़ और प्रतिद्वंद्वी सिस्टम से अधिक स्कोर प्राप्त करता है।
यह मॉडल मंगलवार से Anthropic के API और इसके उपभोक्ता चैटबॉट Claude के माध्यम से उपलब्ध है। उपयोगकर्ता इसे तुरंत एक्सेस कर सकते हैं, हालांकि कंपनी ने लॉन्च के लिए कोई विशिष्ट उपयोग सीमा या दर सीमा का खुलासा नहीं किया है।
मूल्य में कटौती गणित बदलती है
मंगलवार की घोषणा में सबसे चौंकाने वाला विवरण कीमत है। Claude Fable 5 की लागत प्रति टोकन Claude Mythos Preview से आधे से भी कम है। Anthropic ने लॉन्च सामग्री में सटीक प्रति-टोकन आंकड़े जारी नहीं किए, लेकिन छूट इतनी महत्वपूर्ण है कि कंपनी ने इसे रणनीतिक लाभ के रूप में प्रस्तुत किया। बड़ी मात्रा में क्वेरी चलाने वाले डेवलपर्स और व्यवसायों के लिए बचत काफी हो सकती है।
कम कीमत प्रतिस्पर्धियों पर भी दबाव डालती है। OpenAI के GPT-4o और Google के Gemini 1.5 Pro की प्रति-टोकन लागत पुराने Mythos Preview के समान है, जिसका अर्थ है कि Fable 5 कुछ बेंचमार्क पर बेहतर प्रदर्शन का दावा करते हुए मूल्य में उनसे कम है। वास्तविक दुनिया के कार्यभार आंतरिक परीक्षणों से मेल खाते हैं या नहीं, यह देखना बाकी है, लेकिन अकेले मूल्य निर्धारण एंटरप्राइज़ खरीदारों का ध्यान आकर्षित करने की संभावना है।
बेंचमार्क दावे बनाम वास्तविक प्रतिस्पर्धा
Anthropic ने तीन बेंचमार्क श्रेणियों पर तुलना प्रदान की: कोडिंग (HumanEval, SWE-bench और आंतरिक मूल्यांकन का उपयोग करके), वित्त (वित्तीय तर्क और सारांश कार्यों का मिश्रण), और विज़न (छवि कैप्शनिंग और दृश्य प्रश्नोत्तर)। Anthropic के आंकड़ों के अनुसार, प्रत्येक में Fable 5 ने GPT-4o, Gemini 1.5 Pro और Meta के Llama 3.1 405B से अधिक स्कोर किया।
स्वतंत्र सत्यापन अभी तक प्रकाशित नहीं हुआ है। मॉडल बनाने वाली कंपनी के बेंचमार्क परिणाम उद्योग में मानक हैं, लेकिन तीसरे पक्ष के ऑडिट — जैसे Stanford के HELM या LMSYS Chatbot Arena द्वारा चलाए गए — अक्सर संदेह करने वाले डेवलपर्स के बीच अधिक भार रखते हैं। Anthropic ने यह नहीं बताया कि वह Fable 5 को उन मूल्यांकनों में कब या क्या प्रस्तुत करेगा।
यह मॉडल मल्टीमॉडल इनपुट का भी समर्थन करता है, जिसका अर्थ है कि उपयोग




