Secondo Lenz Research, i modelli AI di fact-checking non concordano su due terzi delle affermazioni

Un nuovo studio di Lenz Research ha rilevato che i modelli di intelligenza artificiale discordano sul 67% delle richieste di fact-checking, sollevando dubbi sull'affidabilità dei sistemi di verifica automatizzati. I risultati, pubblicati senza preavviso, suggeriscono che anche gli strumenti AI più avanzati spesso si contraddicono a vicenda quando sono chiamati a determinare la verità. I ricercatori sottolineano la necessità di fonti diversificate e supervisione umana nei processi decisionali, specialmente in ambiti in rapida evoluzione come i mercati finanziari.

La portata del disaccordo

La cifra del 67% è sorprendente. Significa che su ogni tre richieste di fact-checking sottoposte a diversi modelli AI, due generano verdetti contrastanti. Lenz Research non ha specificato quali modelli siano stati testati né la natura delle affermazioni, ma il messaggio è chiaro: nessun sistema AI può essere lasciato da solo a distinguere il vero dal falso. Il tasso di disaccordo indica differenze fondamentali nel modo in cui i modelli vengono addestrati, nei dati che utilizzano e nella loro logica di base.

Nei mercati volatili, dove le voci possono far oscillare i prezzi in pochi secondi, la posta in gioco è alta. Un trader che si affida a un fact-checker AI potrebbe agire in base a un'etichetta che un altro modello rifiuterebbe. Gli autori dello studio menzionano esplicitamente i "mercati volatili" come contesto in cui diventano fondamentali fonti diversificate e il giudizio umano. Gli strumenti automatizzati possono elaborare enormi volumi di dati, ma non possono risolvere le proprie contraddizioni senza un essere umano coinvolto.

Cosa suggerisce lo studio

La raccomandazione di Lenz Research è semplice: non affidarsi a un'unica fonte AI. Invece, incrociare i risultati, coinvolgere revisori umani e trattare i fact-checking automatizzati come uno degli input tra molti. Non è un invito ad abbandonare la tecnologia, ma un avvertimento contro l'eccessiva fiducia. Lo studio non offre una soluzione al problema del disaccordo, ma sostiene con forza la necessità di mantenere le persone nel processo.

I risultati si aggiungono a un crescente insieme di prove che l'AI, nonostante la sua velocità, ha ancora difficoltà con la coerenza. Lenz Research non ha indicato se intende proseguire con un'analisi più approfondita sul perché i modelli discordano o su come allinearli. Per ora, il messaggio è semplice: quando le macchine non riescono a mettersi d'accordo, la decisione spetta agli esseri umani.

La portata del disaccordo

Cosa suggerisce lo studio

Articoli Correlati