Společnost Anthropic v úterý představila Claude Fable 5, svůj nejnovější univerzální model AI a zároveň dosud nejschopnější veřejně dostupný systém. Model třídy Mythos podle interních testů překonává konkurenty v benchmarkech na kódování, finance a vidění. Cena je stanovena na méně než polovinu nákladů vlastního modelu Anthropic Claude Mythos Preview, což je krok, který by mohl otřást přeplněným trhem s velkými jazykovými modely.
Co přináší Claude Fable 5
\nFable 5 je postaven na architektuře Mythos, stejné rodině jako dřívější Mythos Preview. Anthropic však tvrdí, že tato verze posouvá výkon dále v několika klíčových oblastech. V úlohách kódování překonává srovnatelné modely od OpenAI, Google a Meta, uvedla společnost. Benchmarky finanční analýzy rovněž vykazují náskok a úlohy založené na vidění – například interpretace grafů a diagramů – dosahují vyššího skóre než předchozí vydání Anthropicu a konkurenční systémy.
Model je k dispozici od úterý prostřednictvím API Anthropicu a jeho spotřebitelského chatbota Claude. Uživatelé k němu mají okamžitý přístup, ačkoli společnost nezveřejnila konkrétní limit využití nebo omezení rychlosti pro spuštění.
Snížení ceny mění pravidla hry
\nNejvíce překvapivým detailem úterního oznámení je cena. Claude Fable 5 stojí méně než polovinu toho, co si Claude Mythos Preview účtuje za token. Anthropic v propagačních materiálech neuvedl přesná čísla za token, ale sleva je natolik významná, že ji společnost prezentovala jako strategickou výhodu. Pro vývojáře a firmy, které zpracovávají velké objemy dotazů, by úspory mohly být značné.
Nižší cena také vytváří tlak na konkurenty. Model GPT-4o od OpenAI a Gemini 1.5 Pro od Googlu mají podobné náklady na token jako starší Mythos Preview, což znamená, že Fable 5 je cenově podbízí a zároveň si nárokuje lepší výkon v určitých benchmarkách. Zda reálné pracovní zátěže odpovídají interním testům, se teprve ukáže, ale samotná cena pravděpodobně přitáhne pozornost podnikových zákazníků.
Tvrzení o benchmarkách vs. skutečná konkurence
\nAnthropic poskytl srovnání ve třech kategoriích benchmarků: kódování (s využitím HumanEval, SWE-bench a interních hodnocení), finance (směs finančního uvažování a úloh shrnutí) a vidění (popis obrázků a vizuální otázky a odpovědi). Podle dat Anthropicu dosáhl Fable 5 ve všech kategoriích vyššího skóre než GPT-4o, Gemini 1.5 Pro a Meta Llama 3.1 405B.
Nezávislé ověření zatím nebylo zveřejněno. Výsledky benchmarků od společnosti, která model vytváří, jsou v oboru standardem, ale audity třetích stran – například ty prováděné Stanfordským HELM nebo LMSYS Chatbot Arena – mají u skeptických vývojářů často větší váhu. Anthropic neuvedl, kdy nebo zda Fable 5 těmto hodnocením podrobí.
Model také podporuje multimodální vstupy, což znamená, že uživatelé mohou nahrávat obrázky spolu s textem. Tato funkce nebyla k dispozici ve vydání Mythos Preview, které bylo pouze textové. Anthropic tvrdí, že výkon vidění u Fable 5 v testovaných úlohách překonává vyhrazené modely vidění z jiných laboratoří.
Co bude dál
\nAnthropic nezveřejnil časový plán nahrazení starší vrstvy Mythos Preview. Prozatím jsou oba modely k dispozici, ale strmý cenový rozdíl a výkonnostní zisky činí z Fable 5 jasnou volbu pro nové projekty. Stávající uživatelé Mythos Preview by možná chtěli Fable 5 otestovat a porovnat výsledky před migrací produkční zátěže.
Spuštění přichází v době, kdy závod v AI vstupuje do nové fáze – nejde jen o surovou schopnost, ale o cenovou dostupnost ve velkém měřítku. Sázkou Anthropicu je, že levnější a silnější model přiláká zákazníky, kteří se dříve zarazili nad cenou. Zda se tato sázka vyplatí, závisí na tom, jak si Fable 5 povede mimo laboratoř, v chaotickém a nepředvídatelném světě reálných aplikací.




