Anthropic har sluppet oppdateringer til sine Claude 4.6- og Opus 4.7-modeller, med skaleringsråd og nøyaktighetsforbedringer spesifikt for nettleser- og datamaskinoppgaver. Endringene retter seg mot hvordan AI-en håndterer handlinger som klikking, rulling og utfylling av skjemaer, med mål om å redusere feil som kan forstyrre automatiseringsarbeidsflyter.
Hva oppdateringene endrer
De nye versjonene inkluderer modifikasjoner i Claudes underliggende inferenslogikk snarere enn store arkitektoniske ombygginger. Skaleringsrådene er ment å hjelpe modellen med å bedre vurdere når en bred instruksjon bør brytes ned i mindre trinn, mens nøyaktighetsforbedringene adresserer vanlige feilgrep ved tolkning av nettsidekoordinater eller knappetiketter. Anthropic sier at forbedringene gjør modellene mer pålitelige for repeterende oppgaver som dataregistrering, skjemainnsending og flertrinns nettlesernavigasjon.
Hvorfor nettleser- og datamaskinbruk er viktig
Claudes evne til å samhandle med grafiske grensesnitt – ikke bare tekst – har vært et økende fokusområde for Anthropic. Bedrifter og utviklere bruker modellen til robotprosessautomatisering, kundestøtteskript og programvaretesting. Feil i slike sammenhenger kan eskalere raskt: et feilklikket knapp eller en feiltolket nedtrekksmeny kan bryte en hel sekvens. Selskapet har jobbet med disse egenskapene siden de introduserte datamaskinbruksfunksjoner i slutten av 2024.
Hvem får oppdateringene
Versjonene 4.6 og Opus 4.7 er tilgjengelige for API-brukere og via Anthropics konsoll. Opus 4.7 er det kraftigere nivået, rettet mot komplekse, høyinnsats-oppgaver; 4.6 er posisjonert som et raskere, lettere alternativ. Begge modellene leveres nå med de nye skaleringsrådene og nøyaktighetsforbedringene aktivert som standard, ifølge selskapets utgivelsesnotater.
Endringene kommer mens rivaler som OpenAI og Google presser på med lignende agent-stil-funksjoner. Foreløpig fokuserer Anthropic på inkrementelle pålitelighetsforbedringer snarere enn nye glitrende egenskaper. Utviklere som stoler på Claude for å drive nettleserbaserte arbeidsflyter, vil få oppdateringene automatisk – ingen grunn til å omkonfigurere spørsmål eller trene modellen på nytt. Fiksene er allerede aktive i produksjon.




