Manling Li

defense arXiv Aug 5, 2025 · Aug 2025

Evo-MARL: Co-Evolutionary Multi-Agent Reinforcement Learning for Internalized Safety

Zhenyu Pan, Yiting Zhang, Yutong Zhang et al. · Northwestern University · University of Illinois at Chicago

Defends LLM multi-agent systems against jailbreaks by co-evolving attackers and defenders via MARL, internalizing safety without external guard modules

Prompt Injection Excessive Agency multimodalreinforcement-learningnlp

PDF

Papers in Database (1)

Evo-MARL: Co-Evolutionary Multi-Agent Reinforcement Learning for Internalized Safety