Philip S. Yu

defense arXiv Aug 5, 2025 · Aug 2025

Evo-MARL: Co-Evolutionary Multi-Agent Reinforcement Learning for Internalized Safety

Zhenyu Pan, Yiting Zhang, Yutong Zhang et al. · Northwestern University · University of Illinois at Chicago

Defends LLM multi-agent systems against jailbreaks by co-evolving attackers and defenders via MARL, internalizing safety without external guard modules

Prompt Injection Excessive Agency multimodalreinforcement-learningnlp

PDF

tool arXiv Sep 11, 2025 · Sep 2025

MarkDiffusion: An Open-Source Toolkit for Generative Watermarking of Latent Diffusion Models

Leyi Pan, Sheng Guan, Zheyu Fu et al. · Tsinghua University · Beijing University of Posts and Telecommunications +3 more

Open-source Python toolkit for watermarking diffusion model outputs with 24 evaluation tools and 8 automated pipelines

Output Integrity Attack generativevision

PDF Code

Papers in Database (2)

Evo-MARL: Co-Evolutionary Multi-Agent Reinforcement Learning for Internalized Safety

MarkDiffusion: An Open-Source Toolkit for Generative Watermarking of Latent Diffusion Models