Jingjing He

benchmark arXiv Feb 4, 2026 · 8w ago

Yanshu Wang, Shuaishuai Yang, Jingjing He et al. · Peking University

Reveals few-shot demonstrations boost role-oriented jailbreak defenses but degrade task-oriented defenses by up to 21% in LLMs

Prompt Injection nlp

Papers in Database (1)