Hva Claude Fable 5 bringer
Fable 5 er bygget på Mythos-arkitekturen, samme familie som den tidligere Mythos Preview. Men Anthropic sier at denne versjonen presser ytelsen videre på flere sentrale områder. I kodingsoppgaver overgår den sammenlignbare modeller fra OpenAI, Google og Meta, melder selskapet. Referansetester for finansiell analyse viser også et forsprang, og synsbaserte oppgaver – som tolkning av diagrammer og grafer – scorer høyere enn tidligere Anthropic-utgivelser og konkurrerende systemer.
Modellen er tilgjengelig fra tirsdag via Anthropics API og deres forbrukerchatbot, Claude. Brukere kan få tilgang umiddelbart, men selskapet har ikke oppgitt en spesifikk bruksgrense eller takst for lanseringen.
Priskutt endrer regnestykket
Det mest slående ved tirsdagens kunngjøring er prisen. Claude Fable 5 koster mindre enn halvparten av hva Claude Mythos Preview tar per token. Anthropic offentliggjorde ikke eksakte priser per token i lanseringsmaterialet, men rabatten er betydelig nok til at selskapet fremhevet den som en strategisk fordel. For utviklere og bedrifter som kjører store mengder spørringer, kan besparelsene være betydelige.
Den lavere prisen legger også press på konkurrenter. OpenAIs GPT-4o og Googles Gemini 1.5 Pro har tilsvarende priser per token som den eldre Mythos Preview, noe som betyr at Fable 5 underbyr dem på pris samtidig som den hevder overlegen ytelse på visse referansetester. Om virkelige arbeidsbelastninger matcher de interne testene gjenstår å se, men prisen alene vil sannsynligvis tiltrekke seg oppmerksomhet fra bedriftskjøpere.
Referansetest-påstander vs. reell konkurranse
Anthropic presenterte sammenligninger på tre referansetestkategorier: koding (ved hjelp av HumanEval, SWE-bench og interne evalueringer), finans (en blanding av finansiell resonnering og oppsummeringsoppgaver) og syn (bildeteksting og visuell QA). I hver kategori scoret Fable 5 høyere enn GPT-4o, Gemini 1.5 Pro og Metas Llama 3.1 405B, ifølge Anthropics data.
Uavhengig verifisering er ennå ikke publisert. Referansetestresultater fra s




