
Die BoN Jailbreak-Technik: Ein neuer Ansatz zur Ausnutzung von KI-Systemen
Eine neuartige Methode für das Red-Teaming wurde von Forschern mehrerer renommierter Institutionen entwickelt. Anthropic PBC, UCL, Stanford University, University of Oxford und andere haben eine Studie veröffentlicht. Darin wird die Best-of-N (BoN) Jailbreak-Technik als Black-Box-Algorithmus beschrieben.