أنthropic تطلق Claude Fable 5 وتدّعي تفوقًا في الأداء بنصف سعر النموذج السابق

أطلقت شركة Anthropic يوم الثلاثاء نموذج Claude Fable 5، وهو أحدث نموذج ذكاء اصطناعي للأغراض العامة وأكثر أنظمتها العامة تقدمًا حتى الآن. وفقًا للاختبارات الداخلية، يتفوق هذا النموذج من فئة Mythos على المنافسين في معايير البرمجة والمالية والرؤية. تم تحديد السعر بأقل من نصف تكلفة نموذج Claude Mythos Preview الخاص بـ Anthropic، وهي خطوة قد تهز سوق نماذج اللغة الكبيرة المزدحم.

ما يقدمه Claude Fable 5

تم بناء Fable 5 على بنية Mythos، نفس عائلة النموذج السابق Mythos Preview. ولكن Anthropic تقول إن هذه النسخة تدفع الأداء إلى أبعد من ذلك في عدة مجالات رئيسية. في مهام البرمجة، يتفوق على النماذج المنافسة من OpenAI وGoogle وMeta، وفقًا لما ذكرته الشركة. كما تظهر معايير التحليل المالي تقدمًا، والمهام القائمة على الرؤية - مثل تفسير الرسوم البيانية والمخططات - تسجل نتائج أعلى من إصدارات Anthropic السابقة والأنظمة المنافسة.

النموذج متاح اعتبارًا من الثلاثاء عبر واجهة برمجة التطبيقات (API) الخاصة بـ Anthropic وروبوت الدردشة الاستهلاكي Claude. يمكن للمستخدمين الوصول إليه فورًا، على الرغم من أن الشركة لم تكشف عن حد استخدام أو معدل محدد للإطلاق.

تغيير الحسابات بخفض السعر

أبرز تفاصيل إعلان الثلاثاء هو السعر. Claude Fable 5 يكلف أقل من نصف ما يتقاضاه Claude Mythos Preview لكل رمز (token). لم تنشر Anthropic أرقامًا دقيقة لكل رمز في مواد الإطلاق، لكن الخصم كبير بما يكفي لدرجة أن الشركة اعتبرته ميزة استراتيجية. بالنسبة للمطورين والشركات التي تشغل كميات كبيرة من الاستعلامات، يمكن أن تكون التوفيرات كبيرة.

السعر المنخفض يضع ضغطًا أيضًا على المنافسين. تتحمل نماذج GPT-4o من OpenAI وGemini 1.5 Pro من Google تكاليف مشابهة لكل رمز للنموذج الأقدم Mythos Preview، مما يعني أن Fable 5 يقلل أسعارهم بينما يدعي تفوقًا في الأداء على معايير معينة. ما إذا كانت أعباء العمل الحقيقية تتطابق مع الاختبارات الداخلية يبقى غير مؤكد، لكن السعر وحده من المرجح أن يجذب انتباه المشترين المؤسسيين.

ادعاءات المعايير مقابل المنافسة الحقيقية

قدمت Anthropic مقارنات في ثلاث فئات من المعايير: البرمجة (باستخدام HumanEval وSWE-bench والتقييمات الداخلية)، والمالية (مزيج من مهام التفكير المالي والتلخيص)، والرؤية (وصف الصور والأسئلة والأجوبة البصرية). في كل منها، سجل Fable 5 نتائج أعلى من GPT-4o وGemini 1.5 Pro وLlama 3.1 405B من Meta، وفقًا لبيانات Anthropic.

لم يتم نشر التحقق المستقل بعد. تعتبر نتائج المعايير من الشركة التي تبني النموذج معيارًا في الصناعة، لكن عمليات التدقيق من طرف ثالث - مثل تلك التي يديرها HELM من جامعة ستانفورد أو LMSYS Chatbot Arena - غالبًا ما تحمل وزنًا أكبر لدى المطورين المشككين. لم تذكر Anthropic متى أو ما إذا كانت ستقدم Fable 5 لتلك التقييمات.

النموذج يدعم أيضًا المدخلات متعددة الوسائط، مما يعني أن المستخدمين يمكنهم تحميل الصور مع النص. هذه الميزة لم تكن متوفرة في إصدار Mythos Preview الذي كان نصيًا فقط. تقول Anthropic إن أداء الرؤية في Fable 5 يتفوق على نماذج الرؤية المخصصة من مختبرات أخرى في المهام التي تم اختبارها.

ما التالي

لم تعلن Anthropic عن جدول زمني لاستبدال الطبقة الأقدم Mythos Preview. الآن كلا النموذجين متاحان، لكن الفجوة الكبيرة في السعر ومكاسب الأداء تجعل Fable 5 الخيار الواضح للمشاريع الجديدة. قد يرغب المستخدمون الحاليون على Mythos Preview في اختبار Fable 5 ومقارنة النتائج قبل ترحيل أعباء العمل الإنتاجية.

يأتي الإطلاق في وقت تدخل فيه سباق الذكاء الاصطناعي مرحلة جديدة - ليس فقط حول القدرة الخام، بل حول القدرة على تحمل التكاليف على نطاق واسع. تراهن Anthropic على أن نموذجًا أرخص وأقوى سيجذب العملاء الذين ترددوا في التسعير السابق. ما إذا كان هذا الرهان سينجح يعتمد على أداء Fable 5 خارج المختبر، في العالم الفوضوي وغير المتوقع للتطبيقات الحقيقية.

ما يقدمه Claude Fable 5

تغيير الحسابات بخفض السعر

ادعاءات المعايير مقابل المنافسة الحقيقية

ما التالي

مقالات ذات صلة