FT legt AI-veiligheidsgaten bij Meta en Google bloot

Uit tests van de Financial Times blijkt dat de AI-veiligheidscontroles van Meta en Google binnen enkele minuten kunnen worden omzeild. Deze bevindingen trekken de beweringen over de robuustheid van de huidige waarborgen in twijfel.

Testmethode

Journalisten gebruikten standaard invoer om modellen te verleiden tot het genereren van schadelijke inhoud. Ze testen de voor het publiek toegankelijke AI-tools van beide bedrijven onder normale omstandigheden. De omzeiling vond plaats zonder gespecialiseerde technische vaardigheden.

Reacties van de platforms

Meta stelt dat het zijn systemen continu bijwerkt en sinds de test nieuwe beperkingen heeft toegevoegd. Google geeft aan meerdere veiligheidslagen te gebruiken en problemen snel aan te pakken zodra ze worden ontdekt. Geen van beide bedrijven betwistte de bevindingen van de FT.

Toenemende regelgevingsdruk

De deadline van oktober 2024 voor naleving van de EU AI-wet nadert. Toezichthouders wijzen nu op deze tests als bewijs dat de huidige zelfregulering in de sector faalt. Wetgevers in Brussel bestuderen het rapport voor mogelijke handhavingsmaatregelen.

Risico voor gebruikers

Ongefilterde uitkomsten omvatten schadelijk advies en valse informatie. De getroffen tools worden veel gebruikt door consumenten en ontwikkelaars. Bedrijven stellen dat de meeste gebruikers tijdens normaal gebruik geen problemen zullen ondervinden.

De Financial Times-test toont aan hoe gemakkelijk huidige AI-waarborgen kunnen worden doorbroken. Nu moeten de bedrijven deze gaten dichten voor de EU-deadline van oktober.

Testmethode

Reacties van de platforms

Toenemende regelgevingsdruk

Risico voor gebruikers

Related Articles