Anthropic heeft op dinsdag Claude Fable 5 uitgebracht, het nieuwste algemene AI-model en het meest capabele openbaar beschikbare systeem van het bedrijf tot nu toe. Het Mythos-klasse model verslaat concurrenten op het gebied van programmeren, financiën en beeldherkenning, volgens interne tests. De prijs is vastgesteld op minder dan de helft van de kosten van Anthropic's eigen Claude Mythos Preview, een zet die de drukke markt van grote taalmodellen zou kunnen opschudden.
Wat Claude Fable 5 biedt
Fable 5 is gebouwd op de Mythos-architectuur, dezelfde familie als de eerdere Mythos Preview. Maar Anthropic zegt dat deze versie de prestaties verder opdrijft op verschillende belangrijke domeinen. Bij programmeertaken presteert het beter dan vergelijkbare modellen van OpenAI, Google en Meta, aldus het bedrijf. Ook bij benchmarks voor financiële analyse loopt het voorop, en visuele taken — zoals het interpreteren van grafieken en diagrammen — scoren hoger dan eerdere Anthropic-releases en rivaliserende systemen.
Het model is vanaf dinsdag beschikbaar via de API van Anthropic en zijn consumentenchatbot Claude. Gebruikers kunnen er direct toegang toe krijgen, hoewel het bedrijf geen specifieke gebruikslimiet of snelheidsbeperking voor de lancering heeft bekendgemaakt.
Prijsverlaging verandert de rekensom
Het meest opvallende detail in de aankondiging van dinsdag is de prijs. Claude Fable 5 kost minder dan de helft van wat Claude Mythos Preview per token vraagt. Anthropic heeft geen exacte cijfers per token in het lanceermateriaal gepubliceerd, maar de korting is aanzienlijk genoeg dat het bedrijf het als een strategisch voordeel presenteerde. Voor ontwikkelaars en bedrijven die grote hoeveelheden queries uitvoeren, kunnen de besparingen aanzienlijk zijn.
De lagere prijs zet ook concurrenten onder druk. OpenAI's GPT-4o en Google's Gemini 1.5 Pro hebben vergelijkbare kosten per token als de oudere Mythos Preview, wat betekent dat Fable 5 hen onderbiedt op prijs terwijl het op bepaalde benchmarks superieure prestaties claimt. Of de prestaties in de praktijk overeenkomen met de interne tests moet nog blijken, maar alleen al de prijs zal waarschijnlijk de aandacht trekken van zakelijke kopers.
Benchmarkclaims versus echte concurrentie
Anthropic heeft vergelijkingen geleverd op drie benchmarkcategorieën: programmeren (met HumanEval, SWE-bench en interne evaluaties), financiën (een mix van financiële redeneer- en samenvattingstaken) en beeldherkenning (beeldonderschriften en visuele vragen). In elk daarvan scoorde Fable 5 hoger dan GPT-4o, Gemini 1.5 Pro en Meta's Llama 3.1 405B, volgens Anthropic's gegevens.
Onafhankelijke verificatie is nog niet gepubliceerd. Benchmarkresultaten van het bedrijf dat het model bouwt, zijn standaard in de industrie, maar audits van derden — zoals die van Stanford's HELM of de LMSYS Chatbot Arena — wegen vaak zwaarder bij sceptische ontwikkelaars. Anthropic heeft niet gezegd wanneer of of het Fable 5 aan die evaluaties zal onderwerpen.
Het model ondersteunt ook multimodale invoer, wat betekent dat gebruikers afbeeldingen samen met tekst kunnen uploaden. Die functie was niet beschikbaar in de Mythos Preview-release, die alleen tekst was. Anthropic zegt dat de visuele prestaties op Fable 5 die van speciale visiemodellen van andere labs overtreffen op de geteste taken.
Wat komt er daarna
Anthropic heeft nog geen tijdlijn aangekondigd voor het vervangen van de oudere Mythos Preview-tier. Voorlopig blijven beide modellen beschikbaar, maar de grote prijskloof en prestatieverbeteringen maken Fable 5 de voor de hand liggende keuze voor nieuwe projecten. Bestaande gebruikers van Mythos Preview willen misschien Fable 5 testen en resultaten vergelijken voordat ze productieworkloads overzetten.
De lancering valt samen met een nieuwe fase in de AI-wapenwedloop — niet alleen over ruwe capaciteit, maar ook over betaalbaarheid op schaal. Anthropic gokt erop dat een goedkoper, sterker model klanten zal aantrekken die afhaakten bij eerdere prijzen. Of die gok loont, hangt af van hoe Fable 5 presteert buiten het lab, in de rommelige, onvoorspelbare wereld van echte toepassingen.




