Was Claude Fable 5 bietet
Fable 5 basiert auf der Mythos-Architektur, derselben Familie wie das frühere Mythos Preview. Laut Anthropic übertrifft diese Version die Leistung in mehreren Schlüsselbereichen. Bei Programmieraufgaben schlägt es vergleichbare Modelle von OpenAI, Google und Meta, so das Unternehmen. Auch bei Finanzanalyse-Benchmarks liegt es vorn, und bei bildbasierten Aufgaben – etwa der Interpretation von Diagrammen und Grafiken – erzielt es höhere Werte als frühere Anthropic-Veröffentlichungen und Konkurrenzsysteme.
Das Modell ist ab Dienstag über die API von Anthropic und den Verbraucher-Chatbot Claude verfügbar. Nutzer können sofort darauf zugreifen, allerdings hat das Unternehmen keine spezifische Nutzungsbeschränkung oder Ratenbegrenzung für den Start bekannt gegeben.
Preissenkung verändert die Rechnung
Das auffälligste Detail der Ankündigung vom Dienstag ist der Preis. Claude Fable 5 kostet weniger als die Hälfte dessen, was Claude Mythos Preview pro Token verlangt. Anthropic hat in den Launch-Materialien keine genauen Zahlen pro Token genannt, aber der Rabatt ist so groß, dass das Unternehmen ihn als strategischen Vorteil darstellt. Für Entwickler und Unternehmen, die große Abfragemengen verarbeiten, könnten die Einsparungen erheblich sein.
Der niedrigere Preis setzt auch die Konkurrenz unter Druck. OpenAIs GPT-4o und Googles Gemini 1.5 Pro haben ähnliche Kosten pro Token wie das ältere Mythos Preview, was bedeutet, dass Fable 5 sie preislich unterbietet und gleichzeitig eine überlegene Leistung bei bestimmten Benchmarks beansprucht. Ob reale Arbeitslasten den internen Tests standhalten, bleibt abzuwarten, aber allein der Preis dürfte die Aufmerksamkeit von Unternehmenskäufern auf sich ziehen.
Benchmark-Behauptungen vs. echte Konkurrenz
Anthropic lieferte Vergleiche in drei Benchmark-Kategorien: Programmierung (unter Verwendung von HumanEval, SWE-bench und internen Bewertungen), Finanzen (eine Mischung aus finanziellem Denken und Zusammenfassungsaufgaben) und Bilderkennung (Bildunterschriften und visuelle Fragen und Antworten). Laut Anthropics Daten erzielte Fable 5 in jeder Kategorie höhere Werte als GPT-4o, Gemini 1.5 Pro und Metas Llama 3.1 405B.
Eine unabhängige Überprüfung wurde noch nicht veröffentlicht. Benchmark-Ergebnisse des Unternehmens, das das Modell entwickelt, sind in der Branche Standard, aber Überprüfungen durch Dritte – wie die von Stanfords HELM oder der LMSYS Chatbot Arena – haben bei skeptischen Entwicklern oft mehr Gewicht. Anthropic hat nicht gesagt, wann oder ob es Fable 5 diesen Bewertungen unterziehen wird.
Das Modell unterstützt auch multimodale Eingaben, was bedeutet, dass Nutzer Bilder zusammen mit Text hochladen können. Diese Funktion war in der Mythos Preview-Veröffentlichung, die nur Text verarbeitete, nicht verfügbar. Anthropic sagt, dass die Bilderkennungsleistung von Fable 5 bei den getesteten Aufgaben die von dedizierten Bilderkennungsmodellen anderer Labore übertrifft.




