Ivan Zhang

defense arXiv Aug 10, 2025 · Aug 2025

Ivan Zhang · Non-Trivial Research Fellowship · Carnegie Mellon University

Proposes a real-time self-tuning two-agent moderator that adapts to novel LLM jailbreaks without expensive retraining

Prompt Injection nlp

Papers in Database (1)