Ruocheng Shan

defense arXiv Nov 23, 2025 · Nov 2025

Yanxi Li, Ruocheng Shan · George Washington University

Defends LLMs against class-directive prompt injection by disguising output labels with alias terms in few-shot prompts

Prompt Injection nlp

Papers in Database (1)