Mit hoz a Claude Fable 5
A Fable 5 a Mythos architektúrára épül, ugyanabba a családba tartozik, mint a korábbi Mythos Preview. Az Anthropic szerint azonban ez a verzió tovább növeli a teljesítményt több kulcsfontosságú területen. Programozási feladatokban felülmúlja az OpenAI, a Google és a Meta hasonló modelljeit – jelentette a vállalat. A pénzügyi elemzési benchmarkokban is vezet, és a látásalapú feladatok – például diagramok és ábrák értelmezése – magasabb pontszámot érnek el, mint az Anthropic korábbi kiadásai és a versenytárs rendszerei.
A modell keddtől elérhető az Anthropic API-ján és fogyasztói chatbotján, a Claude-on keresztül. A felhasználók azonnal hozzáférhetnek, bár a vállalat nem hozta nyilvánosságra a használati korlátot vagy a sebességkorlátozást a bevezetéskor.
Az árcsökkentés megváltoztatja a számításokat
A kedd bejelentésének legszembetűnőbb részlete az ár. A Claude Fable 5 tokenenként kevesebb mint felébe kerül, mint a Claude Mythos Preview. Az Anthropic nem közölt pontos tokenenkénti összegeket a bevezető anyagokban, de a kedvezmény elég jelentős ahhoz, hogy a vállalat stratégiai előnyként hivatkozzon rá. Azoknak a fejlesztőknek és vállalkozásoknak, amelyek nagy mennyiségű lekérdezést futtatnak, a megtakarítás jelentős lehet.
Az alacsonyabb ár nyomást gyakorol a versenytársakra is. Az OpenAI GPT-4o és a Google Gemini 1.5 Pro tokenenkénti költsége hasonló a régebbi Mythos Preview-hoz, így a Fable 5 árat tekintve alákínál nekik, miközben bizonyos benchmarkokon jobb teljesítményt állít. Hogy a valós munkaterhelések megfelelnek-e a belső teszteknek, az még kiderül, de maga az árazás valószínűleg felkelti a vállalati vásárlók figyelmét.
Benchmark-állítások kontra valós verseny
Az Anthropic három benchmark kategóriában nyújtott összehasonlításokat: programozás (HumanEval, SWE-bench és belső értékelések), pénzügy (pénzügyi érvelési és összefoglalási feladatok keveréke) és látás (képfeliratozás és vizuális kérdések megválaszolása). Az Anthropic adatai szerint mindegyikben a Fable 5 magasabb pontszámot ért el, mint a GPT-4o, a Gemini 1.5 Pro és a Meta Llama 3.1 405B.
Független verifikáció még nem jelent meg. A modellt készítő vállalat benchmarkeredményei iparági szabványnak számítanak, de a harmadik fél általi auditok – mint a Stanford HELM vagy az LMSYS Chatbot Arena által végzettek – gyakran nagyobb súllyal bírnak a szkeptikus fejlesztők körében. Az Anthropic nem közölte, hogy mikor vagy ha egyáltalán benyújtja a Fable 5-öt ezekre az értékelésekre.
A modell multimodális bemeneteket is támogat, vagyis a felhasználók képeket tölthetnek fel szöveg mellett. Ez a funk




