Anthropic lancerer Claude Fable 5 – hævder toppræstation til halv pris af tidligere model

Anthropic udrullede tirsdag Claude Fable 5, deres nyeste generelle AI-model og virksomhedens hidtil mest dygtige offentligt tilgængelige system. Mythos-klasse-modellen overgår konkurrenterne inden for kodning, finans og vision-benchmarks, ifølge interne test. Prisen er sat til under halvdelen af, hvad Anthropics egen Claude Mythos Preview koster – et træk, der kan ryste det pressede marked for store sprogmodeller.

Hvad Claude Fable 5 byder på

Fable 5 er bygget på Mythos-arkitekturen, samme familie som den tidligere Mythos Preview. Men Anthropic siger, at denne version skubber ydeevnen endnu længere på tværs af flere nøgleområder. I kodningsopgaver overgår den sammenlignelige modeller fra OpenAI, Google og Meta, oplyser virksomheden. Finansielle analyse-benchmarks viser også et forspring, og visionsbaserede opgaver – såsom fortolkning af diagrammer og grafer – scorer højere end tidligere Anthropic-udgivelser og konkurrerende systemer.

Modellen er tilgængelig fra tirsdag via Anthropics API og deres forbruger-chatbot, Claude. Brugere kan få adgang med det samme, men virksomheden har ikke oplyst en specifik brugsgrænse eller hastighedsbegrænsning for lanceringen.

Prisnedsættelse ændrer regnestykket

Det mest iøjnefaldende ved tirsdagens annoncering er prisen. Claude Fable 5 koster mindre end halvdelen af, hvad Claude Mythos Preview opkræver per token. Anthropic offentliggjorde ikke præcise per token-tal i lanceringsmaterialet, men rabatten er betydelig nok til, at virksomheden fremhævede det som en strategisk fordel. For udviklere og virksomheder, der kører store mængder forespørgsler, kan besparelserne være betydelige.

Den lavere pris lægger også pres på konkurrenterne. OpenAIs GPT-4o og Googles Gemini 1.5 Pro har lignende per token-omkostninger som den ældre Mythos Preview, hvilket betyder, at Fable 5 underbyder dem prismæssigt, samtidig med at den hævder overlegen ydeevne på visse benchmarks. Hvorvidt virkelige arbejdsbelastninger lever op til de interne test, må tiden vise, men alene prissætningen vil sandsynligvis tiltrække opmærksomhed fra virksomhedskøbere.

Benchmark-påstande vs. reel konkurrence

Anthropic fremlagde sammenligninger på tre benchmark-kategorier: kodning (ved brug af HumanEval, SWE-bench og interne evalueringer), finans (en blanding af finansielle ræsonnement- og opsummeringsopgaver) og vision (billedtekstning og visuel QA). I hver kategori scorede Fable 5 højere end GPT-4o, Gemini 1.5 Pro og Metas Llama 3.1 405B, ifølge Anthropics data.

Uafhængig verifikation er endnu ikke offentliggjort. Benchmark-resultater fra den virksomhed, der bygger modellen, er standard i branchen, men tredjepartsrevisioner – som dem fra Stanfords HELM eller LMSYS Chatbot Arena – vejer ofte tungere hos skeptiske udviklere. Anthropic oplyste ikke, hvornår eller om de vil indsende Fable 5 til disse evalueringer.

Modellen understøtter også multimodale input, hvilket betyder, at brugere kan uploade billeder sammen med tekst. Denne funktion var ikke tilgængelig i Mythos Preview-udgivelsen, som kun var tekstbaseret. Anthropic siger, at vision-ydeevnen på Fable 5 overgår dedikerede visionsmodeller fra andre laboratorier på de testede opgaver.

Hvad der kommer næste

Anthropic har ikke annonceret en tidsplan for udskiftning af den ældre Mythos Preview-tier. For nu er begge modeller tilgængelige, men det store prisspring og præstationsforbedringerne gør Fable 5 til det oplagte valg for nye projekter. Eksisterende brugere af Mythos Preview bør måske teste Fable 5 og sammenligne resultater, før de overfører produktionsarbejdsbelastninger.

Lanceringen falder samtidig med, at AI-våbenkapløbet går ind i en ny fase – ikke kun om rå kapacitet, men om overkommelig pris i stor skala. Anthropics væddemål er, at en billigere, stærkere model vil tiltrække kunder, der veg tilbage fra tidligere priser. Om væddemålet betaler sig, afhænger af, hvordan Fable 5 præsterer uden for laboratoriet – i den rodede, uforudsigelige verden af virkelige applikationer.

Hvad Claude Fable 5 byder på

Prisnedsættelse ændrer regnestykket

Benchmark-påstande vs. reel konkurrence

Hvad der kommer næste

Related Articles