Modely pro kontrolu faktů pomocí umělé inteligence se neshodují u dvou třetin tvrzení, zjistil Lenz Research

Nová studie společnosti Lenz Research zjistila, že modely umělé inteligence se neshodují na 67 % tvrzení při ověřování faktů, což vrhá pochybnosti na spolehlivost automatizovaných ověřovacích systémů. Zjištění, zveřejněná bez předchozího oznámení, naznačují, že i pokročilé nástroje AI si často odporují, když mají za úkol určit pravdu. Výzkumníci stojící za studií zdůrazňují potřebu rozmanitých zdrojů a lidského dohledu při rozhodování, zejména v rychle se měnících oblastech, jako jsou finanční trhy.

Rozsah neshod

Údaj 67 % je zarážející. Znamená to, že ze každých tří tvrzení prověřených různými modely AI skončí dvě s protichůdnými závěry. Lenz Research neuvedla, které modely byly testovány ani jaká byla povaha tvrzení, ale důsledek je jasný: žádný jednotlivý systém AI nelze samostatně považovat za spolehlivý při rozlišování faktů od fikce. Míra neshody poukazuje na zásadní rozdíly v tom, jak jsou modely trénovány, z jakých dat čerpají a jaká je jejich základní logika.

Na volatilních trzích, kde mohou zvěsti hýbat cenami během vteřin, jsou sázky vysoké. Obchodník spoléhající na AI ověřovač faktů by mohl jednat na základě označení, které by jiný model odmítl. Autoři studie výslovně zmiňují „volatilní trhy" jako kontext, kde se rozmanité zdroje a lidský úsudek stávají klíčovými. Automatizované nástroje dokáží zpracovávat obrovské objemy, ale bez zapojení člověka nedokáží vyřešit své vlastní rozpory.

Co studie naznačuje

Doporučení společnosti Lenz Research je přímočaré: nespoléhejte na jediný zdroj AI. Místo toho křížově ověřujte výsledky, zapojte lidské recenzenty a považujte automatizované kontroly faktů za jeden z mnoha vstupů. Nejde o výzvu k opuštění technologie – je to varování před přílišnou sebedůvěrou. Studie nenabízí řešení problému neshod, ale silně argumentuje pro zachování zapojení lidí.

Zjištění přidávají k rostoucí hromadě důkazů, že AI, přes veškerou svou rychlost, stále bojuje s konzistencí. Lenz Research neuvedla, zda plánuje navázat hlubší analýzou toho, proč se modely neshodují nebo jak je sladit. Prozatím je zpráva jednoduchá: když se stroje neshodnou, rozhodnutí náleží lidem.

Rozsah neshod

Co studie naznačuje

Related Articles