Le terme « jailbreaking » désignait autrefois le fait de débrider les iPhones pour installer des applications non autorisées. Aujourd'hui, il décrit un autre type de piratage : tromper les chatbots IA pour qu'ils ignorent leurs garde-fous intégrés. Pour les développeurs de grands modèles de langage comme ChatGPT, ce jeu du chat et de la souris est un casse-tête permanent.
Des iPhones aux prompts
Le mot « jailbreaking » vient de l'ère des iPhone, où les utilisateurs contournaient les restrictions d'Apple via des outils comme Cydia. Cette même idée a été réutilisée pour les systèmes d'IA. Tout comme les jail




