AI-faktatjekmodeller er uenige om to tredjedele af påstande, viser Lenz Research

En ny undersøgelse fra Lenz Research viser, at kunstige intelligensmodeller er uenige om 67% af faktatjekpåstande, hvilket sår tvivl om pålideligheden af automatiserede verifikationssystemer. Resultaterne, der blev offentliggjort uden forudgående varsel, antyder, at selv avancerede AI-værktøjer ofte modsiger hinanden, når de får til opgave at afgøre, hvad der er sandt. Forskere bag undersøgelsen understreger behovet for forskellige kilder og menneskeligt tilsyn i beslutningstagningen, især i hurtigt bevægelige områder som finansielle markeder.

Omfanget af uenighed

Tallet 67% er slående. Det betyder, at for hver tredje faktatjekpåstand, der køres gennem forskellige AI-modeller, ender to med modstridende afgørelser. Lenz Research specificerede ikke, hvilke modeller der blev testet, eller påstandenes karakter, men implikationen er klar: intet enkelt AI-system kan alene stole på til at skelne mellem sandhed og fiktion. Uenighedsraten peger på grundlæggende forskelle i, hvordan modeller trænes, de data de trækker på, og deres underliggende logik.

På volatile markeder, hvor rygter kan flytte priser på få sekunder, er indsatsen høj. En trader, der stoler på en AI-faktatjekker, kan handle på en label, som en anden model ville afvise. Undersøgelsens forfattere nævner eksplicit “volatile markeder” som en kontekst, hvor forskellige kilder og menneskelig dømmekraft bliver afgørende. Automatiserede værktøjer kan behandle store mængder, men de kan ikke løse deres egne modsætninger uden en person i processen.

Hvad undersøgelsen antyder

Anbefalingen fra Lenz Research er ligetil: læn dig ikke op ad en enkelt AI-kilde. Krydstjek i stedet output, inddrag menneskelige anmeldere, og behandl automatiserede faktatjek som én input blandt mange. Dette er ikke et kald om at opgive teknologien – det er en advarsel mod overmod. Undersøgelsen tilbyder ikke en løsning på uenighedsproblemet, men den argumenterer stærkt for at holde mennesker involveret.

Resultaterne føjer sig til en voksende bunke af beviser på, at AI, trods sin hastighed, stadig kæmper med konsistens. Lenz Research har ikke angivet, om det planlægger at følge op med en dybere analyse af, hvorfor modeller er uenige, eller hvordan man kan justere dem. For nu er budskabet enkelt: når maskinerne ikke kan blive enige, tilhører beslutningen menneskerne.

Omfanget af uenighed

Hvad undersøgelsen antyder

Related Articles