Loading market data...

Anthropic julkaisee Claude Fable 5:n, väittää olevansa suorituskyvyltään paras puolella edellisen mallin hinnasta

Anthropic julkaisee Claude Fable 5:n, väittää olevansa suorituskyvyltään paras puolella edellisen mallin hinnasta

Mitä Claude Fable 5 tuo tullessaan

Fable 5 on rakennettu Mythos-arkkitehtuurille, samaan perheeseen kuin aiempi Mythos Preview. Anthropicin mukaan tämä versio kuitenkin parantaa suorituskykyä useilla keskeisillä alueilla. Yritys raportoi, että ohjelmointitehtävissä se päihittää OpenAI:n, Googlen ja Metan vastaavat mallit. Myös rahoitusanalyysin vertailuarvoissa se johtaa, ja näköön perustuvat tehtävät – kuten kaavioiden ja kuvioiden tulkinta – saavat korkeammat pisteet kuin aiemmat Anthropicin julkaisut ja kilpailevat järjestelmät.

Malli on saatavilla tiistaista alkaen Anthropicin API:n ja kuluttajille tarkoitetun Claude-keskustelurobotin kautta. Käyttäjät voivat käyttää sitä välittömästi, vaikka yritys ei olekaan ilmoittanut tarkkaa käyttökattoa tai nopeusrajoitusta julkaisulle.

Hinnanalennus muuttaa laskelmia

Tiistain ilmoituksen silmiinpistävin yksityiskohta on hinta. Claude Fable 5 maksaa alle puolet siitä, mitä Claude Mythos Preview veloittaa tokenia kohti. Anthropic ei julkaissut tarkkoja tokenikohtaisia lukuja julkaisumateriaaleissaan, mutta alennus on riittävän merkittävä, että yritys esitti sen strategisena etuna. Kehittäjille ja yrityksille, jotka käsittelevät suuria määriä kyselyitä, säästöt voivat olla huomattavia.

Alempi hinta painostaa myös kilpailijoita. OpenAI:n GPT-4o ja Googlen Gemini 1.5 Pro -mallien tokenikohtaiset kustannukset ovat samaa luokkaa kuin vanhemman Mythos Preview -mallin, joten Fable 5 alittaa ne hinnassa samalla kun väittää olevansa parempi tietyissä vertailuarvoissa. Jää nähtäväksi, vastaavatko todelliset työkuormat sisäisiä testejä, mutta pelkkä hinnoittelu todennäköisesti herättää yritysostajien huomion.

Vertailuarvojen väitteet vs. todellinen kilpailu

Anthropic toimitti vertailuja kolmessa luokassa: ohjelmointi (HumanEval, SWE-bench ja sisäiset arvioinnit), rahoitus (rahoituspäättelyn ja tiivistämistehtävien yhdistelmä) ja näkö (kuvatekstitys ja visuaalinen kysely-vastaus). Jokaisessa Fable 5 sai korkeammat pisteet kuin GPT-4o, Gemini 1.5 Pro ja Metan Llama 3.1 405B Anthropicin tietojen mukaan.

Riippumattomia vahvistuksia ei ole vielä julkaistu. Mallin rakentaneen yrityksen omat vertailuarvotulokset ovat alalla tavanomaisia, mutta kolmannen osapuolen tarkastukset – kuten Stanfordin HELM tai LMSYS Chatbot Arena -projektien suorittamat – painavat usein enemmän epäilevien kehittäjien silmissä. Anthropic ei kertonut, milloin tai jos se toimittaa Fable 5:n näihin arviointeihin.

Malli tukee myös multimodaalisia syötteitä, eli käyttäjät voivat ladata kuvia tekstin rinnalle. Tämä ominaisuus ei ollut saatavilla Mythos Preview -julkaisussa, joka oli vain tekstiä. Anthropic sanoo, että Fable 5:n näkösuorituskyky ylittää muiden laboratorioiden omistautuneiden näkömallien suorituskyvyn testatuissa tehtävissä.

Mitä seuraavaksi

Anthropic ei ole ilmoittanut aikataulua vanhemman Mythos Preview -tason korvaamiselle. Toistaiseksi molemmat mallit ovat saatavilla, mutta jyrkkä hintaero ja suorituskyvyn parannukset tekevät Fable 5:stä ilmeisen valinnan uusille projekteille. Nykyiset Mythos Preview -käyttäjät saattavat haluta testata Fable 5:tä ja vertailla tuloksia ennen tuotantokuormien siirtämistä.

Julkaisu osuu aikaan, jolloin tekoälyn asevarustelukilpailu on siirtymässä uuteen vaiheeseen – ei enää pelkästään raakaan suorituskykyyn, vaan myös kohtuuhintaisuuteen mittakaavassa. Anthropicin vedonlyönti on, että halvempi ja v