Rui Zhu

defense arXiv Nov 24, 2025 · Nov 2025

Xurui Li, Kaisong Song, Rui Zhu et al. · Fudan University · Alibaba Group +3 more

Co-evolving attack-defense framework uses MCTS-based jailbreak exploration and curriculum RL to jointly train stronger LLM safety alignment

Prompt Injection nlp

2 citations PDF Code

Papers in Database (1)