Anthropic lancia Claude Fable 5, afferma prestazioni di punta a metà prezzo del modello precedente

Cosa offre Claude Fable 5

Fable 5 è costruito sull'architettura Mythos, della stessa famiglia del precedente Mythos Preview. Ma Anthropic afferma che questa versione spinge ulteriormente le prestazioni in diversi settori chiave. Nei compiti di programmazione, supera modelli comparabili di OpenAI, Google e Meta, ha riferito l'azienda. Anche i benchmark di analisi finanziaria mostrano un vantaggio, e i compiti basati sulla visione — come l'interpretazione di grafici e diagrammi — ottengono punteggi più alti rispetto alle versioni precedenti di Anthropic e ai sistemi concorrenti.

Il modello è disponibile da martedì tramite l'API di Anthropic e il suo chatbot consumer, Claude. Gli utenti possono accedervi immediatamente, anche se l'azienda non ha rivelato un limite di utilizzo o un rate limit specifico per il lancio.

Il taglio di prezzo cambia le carte in tavola

Il dettaglio più sorprendente nell'annuncio di martedì è il prezzo. Claude Fable 5 costa meno della metà di quanto addebitato da Claude Mythos Preview per token. Anthropic non ha rilasciato cifre esatte per token nei materiali di lancio, ma lo sconto è abbastanza significativo che l'azienda lo ha presentato come un vantaggio strategico. Per sviluppatori e aziende che eseguono grandi volumi di query, i risparmi potrebbero essere sostanziali.

Il prezzo più basso mette anche sotto pressione i concorrenti. GPT-4o di OpenAI e Gemini 1.5 Pro di Google hanno costi per token simili al vecchio Mythos Preview, il che significa che Fable 5 li sottoprezza mentre rivendica prestazioni superiori su determinati benchmark. Resta da vedere se i carichi di lavoro reali corrispondano ai test interni, ma il solo prezzo probabilmente attirerà l'attenzione degli acquirenti aziendali.

Rivendicazioni sui benchmark vs. concorrenza reale

Anthropic ha fornito confronti su tre categorie di benchmark: programmazione (utilizzando HumanEval, SWE-bench e valutazioni interne), finanza (un mix di compiti di ragionamento finanziario e riepilogo) e visione (didascalie di immagini e QA visivo). In ciascuna, Fable 5 ha ottenuto punteggi più alti di GPT-4o, Gemini 1.5 Pro e Llama 3.1 405B di Meta, secondo i dati di Anthropic.

La verifica indipendente non è stata ancora pubblicata. I risultati dei benchmark provenienti dall'azienda che costruisce il modello sono standard nel settore, ma gli audit di terze parti — come quelli condotti da Stanford HELM o LMSYS Chatbot Arena — spesso hanno più peso con gli sviluppatori scettici. Anthropic non ha detto quando o se sottoporrà Fable 5 a quelle valutazioni.

Il modello supporta anche input multimodali, consentendo agli utenti di caricare immagini insieme al testo. Questa funzionalità non era disponibile

Cosa offre Claude Fable 5

Il taglio di prezzo cambia le carte in tavola

Rivendicazioni sui benchmark vs. concorrenza reale

Articoli Correlati