AI-feitencontrolemodellen zijn het over twee derde van de claims oneens, blijkt uit Lenz Research

Uit een nieuw onderzoek van Lenz Research blijkt dat kunstmatige intelligentiemodellen het bij 67% van de feitencontroleclaims oneens zijn, wat twijfel zaait over de betrouwbaarheid van geautomatiseerde verificatiesystemen. De resultaten, die zonder voorafgaande aankondiging werden gepubliceerd, suggereren dat zelfs geavanceerde AI-tools elkaar vaak tegenspreken wanneer ze de waarheid moeten bepalen. De onderzoekers benadrukken de noodzaak van diverse bronnen en menselijk toezicht bij besluitvorming, vooral in snel bewegende gebieden zoals financiële markten.

De omvang van de onenigheid

Het cijfer van 67% is opvallend. Het betekent dat van elke drie feitencontroleclaims die door verschillende AI-modellen worden gecontroleerd, er twee tot tegenstrijdige conclusies leiden. Lenz Research specificeerde niet welke modellen werden getest of de aard van de claims, maar de implicatie is duidelijk: geen enkel AI-systeem kan op zichzelf worden vertrouwd om feit van fictie te scheiden. De mate van onenigheid wijst op fundamentele verschillen in hoe modellen zijn getraind, de gegevens waarop ze zich baseren en hun onderliggende logica.

In volatiele markten, waar geruchten prijzen in seconden kunnen doen bewegen, zijn de risico's hoog. Een handelaar die vertrouwt op een AI-feitencontroleur kan handelen op basis van een label dat een ander model zou verwerpen. De auteurs van het onderzoek noemen expliciet 'volatiele markten' als een context waarin diverse bronnen en menselijk oordeel cruciaal worden. Geautomatiseerde tools kunnen grote hoeveelheden verwerken, maar kunnen zonder menselijke tussenkomst hun eigen tegenstrijdigheden niet oplossen.

Wat het onderzoek suggereert

De aanbeveling van Lenz Research is eenvoudig: vertrouw niet op één enkele AI-bron. Kruis in plaats daarvan resultaten aan, betrek menselijke beoordelaars en behandel geautomatiseerde feitencontroles als slechts één van vele inputs. Dit is geen oproep om de technologie te verlaten – het is een waarschuwing tegen overmoed. Het onderzoek biedt geen oplossing voor het probleem van onenigheid, maar maakt een sterk pleidooi om mensen erbij te betrekken.

De resultaten voegen zich bij een groeiende stapel bewijs dat AI, ondanks al zijn snelheid, nog steeds worstelt met consistentie. Lenz Research heeft niet aangegeven of het van plan is om een vervolgonderzoek te doen naar waarom modellen het oneens zijn of hoe ze op één lijn te krijgen. Voor nu is de boodschap simpel: wanneer de machines het niet eens kunnen worden, is de beslissing aan de mens.

De omvang van de onenigheid

Wat het onderzoek suggereert

Related Articles