Guoli Wang

defense arXiv Nov 9, 2025 · Nov 2025

Haonan Shi, Guoli Wang, Tu Ouyang et al. · Case Western Reserve University

Defends small LLMs against jailbreaks via selective safety reasoning that activates only for dangerous queries, cutting overhead 90%

Prompt Injection nlp

Papers in Database (1)