AI-faktsjekkmodeller er uenige om to tredjedeler av påstander, ifølge Lenz Research

En ny studie fra Lenz Research har funnet at kunstig intelligens-modeller er uenige om 67 prosent av faktsjekkpåstander, noe som kaster tvil på påliteligheten til automatiserte verifikasjonssystemer. Funnet, som ble offentliggjort uten forhåndsvarsel, tyder på at selv avanserte AI-verktøy ofte motstrider hverandre når de skal vurdere sannheten. Forskerne bak studien understreker behovet for ulike kilder og menneskelig overvåkning i beslutningsprosesser, spesielt i raskt skiftende områder som finansmarkeder.

Uenighetens omfang

Tallet 67 prosent er påfallende. Det betyr at av hver tredje faktsjekkpåstand som kjøres gjennom ulike AI-modeller, ender to med motstridende konklusjoner. Lenz Research oppga ikke hvilke modeller som ble testet eller arten av påstandene, men konklusjonen er klar: ingen enkelt AI-system kan stole på for å skille fakta fra fiksjon på egen hånd. Uenighetsraten peker på grunnleggende forskjeller i hvordan modeller er trent, hvilken data de bygger på og deres underliggende logikk.

I svingende markeder, hvor rykter kan flytte priser på sekunder, er innsatsen stor. En handel som stoler på en AI-faktsjekker kan handle basert på en merking som en annen modell ville forkaste. Studiens forfattere nevner eksplisitt «svingende markeder» som en kontekst der ulike kilder og menneskelig vurdering blir kritisk. Automatiserte verktøy kan behandle enorme mengder data, men de kan ikke løse egne motsetninger uten en person i prosessen.

Hva studien viser

Anbefalingen fra Lenz Research er enkel: ikke støtt deg på en enkelt AI-kilde. I stedet bør du krysjsjekke resultater, inkludere menneskelige revisorer og behandle automatiserte faktsjekk som én innput blant mange. Dette er ikke en oppfordring til å forlate teknologien – det er en advarsel mot overmod. Studien foreslår ikke en løsning på uenighetsproblemet, men argumenterer sterkt for at mennesker må være involvert.

Funnet legger til en voksende mengde bevis på at AI, for alt sin hastighet, fremdeles kæmper med konsistens. Lenz Research har ikke indikert om de planlegger å følge opp med en dypere analyse av hvorfor modeller er uenige eller hvordan de kan justeres. For nå er meldingen enkel: når maskinene ikke kan bli enige, tilhører beslutningen mennesker.

Uenighetens omfang

Hva studien viser

Related Articles