Der Begriff 'Jailbreaking' bedeutete früher, iPhones zu knacken, um nicht autorisierte Apps zu installieren. Jetzt beschreibt er eine andere Art von Hack: KI-Chatbots dazu zu bringen, ihre eingebauten Sicherheitsvorkehrungen zu ignorieren. Für Entwickler großer Sprachmodelle wie ChatGPT ist dieses Katz-und-Maus-Spiel ein ständiges Kopfzerbrechen.
Von Telefonen zu Prompts
Das Wort 'Jailbreaking' stammt aus der iPhone-Ära, als Nutzer mit Tools wie Cydia Apples Beschränkungen umgingen. Dieselbe Idee wurde nun auf KI-Systeme übertragen. So wie iPhone-Jailbreaker Software ausführen wollten, die Apple nicht genehmigt hatte




