Loading market data...

Anthropic uvádí Claude Fable 5, tvrdí nejlepší výkon za poloviční cenu oproti předchozímu modelu

Anthropic uvádí Claude Fable 5, tvrdí nejlepší výkon za poloviční cenu oproti předchozímu modelu

Společnost Anthropic v úterý představila Claude Fable 5, svůj nejnovější univerzální model AI a zároveň dosud nejschopnější veřejně dostupný systém. Model třídy Mythos podle interních testů překonává konkurenty v benchmarkech na kódování, finance a vidění. Cena je stanovena na méně než polovinu nákladů vlastního modelu Anthropic Claude Mythos Preview, což je krok, který by mohl otřást přeplněným trhem s velkými jazykovými modely.

Co přináší Claude Fable 5

\n

Fable 5 je postaven na architektuře Mythos, stejné rodině jako dřívější Mythos Preview. Anthropic však tvrdí, že tato verze posouvá výkon dále v několika klíčových oblastech. V úlohách kódování překonává srovnatelné modely od OpenAI, Google a Meta, uvedla společnost. Benchmarky finanční analýzy rovněž vykazují náskok a úlohy založené na vidění – například interpretace grafů a diagramů – dosahují vyššího skóre než předchozí vydání Anthropicu a konkurenční systémy.

Model je k dispozici od úterý prostřednictvím API Anthropicu a jeho spotřebitelského chatbota Claude. Uživatelé k němu mají okamžitý přístup, ačkoli společnost nezveřejnila konkrétní limit využití nebo omezení rychlosti pro spuštění.

Snížení ceny mění pravidla hry

\n

Nejvíce překvapivým detailem úterního oznámení je cena. Claude Fable 5 stojí méně než polovinu toho, co si Claude Mythos Preview účtuje za token. Anthropic v propagačních materiálech neuvedl přesná čísla za token, ale sleva je natolik významná, že ji společnost prezentovala jako strategickou výhodu. Pro vývojáře a firmy, které zpracovávají velké objemy dotazů, by úspory mohly být značné.

Nižší cena také vytváří tlak na konkurenty. Model GPT-4o od OpenAI a Gemini 1.5 Pro od Googlu mají podobné náklady na token jako starší Mythos Preview, což znamená, že Fable 5 je cenově podbízí a zároveň si nárokuje lepší výkon v určitých benchmarkách. Zda reálné pracovní zátěže odpovídají interním testům, se teprve ukáže, ale samotná cena pravděpodobně přitáhne pozornost podnikových zákazníků.

Tvrzení o benchmarkách vs. skutečná konkurence

\n

Anthropic poskytl srovnání ve třech kategoriích benchmarků: kódování (s využitím HumanEval, SWE-bench a interních hodnocení), finance (směs finančního uvažování a úloh shrnutí) a vidění (popis obrázků a vizuální otázky a odpovědi). Podle dat Anthropicu dosáhl Fable 5 ve všech kategoriích vyššího skóre než GPT-4o, Gemini 1.5 Pro a Meta Llama 3.1 405B.

Nezávislé ověření zatím nebylo zveřejněno. Výsledky benchmarků od společnosti, která model vytváří, jsou v oboru standardem, ale audity třetích stran – například ty prováděné Stanfordským HELM nebo LMSYS Chatbot Arena – mají u skeptických vývojářů často větší váhu. Anthropic neuvedl, kdy nebo zda Fable 5 těmto hodnocením podrobí.

Model také podporuje multimodální vstupy, což znamená, že uživatelé mohou nahrávat obrázky spolu s textem. Tato funkce nebyla k dispozici ve vydání Mythos Preview, které bylo pouze textové. Anthropic tvrdí, že výkon vidění u Fable 5 v testovaných úlohách překonává vyhrazené modely vidění z jiných laboratoří.

Co bude dál

\n

Anthropic nezveřejnil časový plán nahrazení starší vrstvy Mythos Preview. Prozatím jsou oba modely k dispozici, ale strmý cenový rozdíl a výkonnostní zisky činí z Fable 5 jasnou volbu pro nové projekty. Stávající uživatelé Mythos Preview by možná chtěli Fable 5 otestovat a porovnat výsledky před migrací produkční zátěže.

Spuštění přichází v době, kdy závod v AI vstupuje do nové fáze – nejde jen o surovou schopnost, ale o cenovou dostupnost ve velkém měřítku. Sázkou Anthropicu je, že levnější a silnější model přiláká zákazníky, kteří se dříve zarazili nad cenou. Zda se tato sázka vyplatí, závisí na tom, jak si Fable 5 povede mimo laboratoř, v chaotickém a nepředvídatelném světě reálných aplikací.