Ouxiang Li

attack arXiv Dec 8, 2025 · Dec 2025

Xiqiao Xiong, Ouxiang Li, Zhuo Liu et al. · University of Science and Technology of China · National University of Singapore +1 more

RL-trained multi-turn jailbreak attacker using process rewards to guide trajectory-level LLM prompt optimization

Prompt Injection nlpreinforcement-learning

Papers in Database (1)