Qianli Zhou

defense arXiv Nov 24, 2025 · Nov 2025

Junbo Zhang, Ran Chen, Qianli Zhou et al. · Northwestern Polytechnical University

Defends LLMs against jailbreaks via safety-representation intervention that reduces over-refusal without sacrificing safety alignment

Prompt Injection nlp

1 citations PDF

Papers in Database (1)