Kavishvaran Srinivasan

defense arXiv Nov 24, 2025 · Nov 2025

Ryan Wong, Hosea David Yu Fei Ng, Dhananjai Sharma et al. · National University of Singapore

Proposes three LLM jailbreak defenses — prompt sanitization, logit steering, and agent-based — with benchmark evaluation

Prompt Injection nlp

Papers in Database (1)