Nils Lukas

defense arXiv Aug 12, 2025 · Aug 2025

Yutong Wu, Jie Zhang, Yiming Li et al. · Nanyang Technological University · Technology and Research +2 more

Proposes Cowpox, a distributed cure-sample defense immunizing VLM multi-agent systems against propagating jailbreak infections

Prompt Injection Excessive Agency multimodalnlp

attack arXiv Aug 28, 2025 · Aug 2025

Fahad Shamshad, Tameem Bakr, Yahia Shaaban et al. · Mohamed bin Zayed University of Artificial Intelligence · Michigan State University

Wins NeurIPS 2024 watermark removal challenge via adaptive VAE evasion and diffusion purification, achieving 95.7% removal rate

Output Integrity Attack visiongenerative

Papers in Database (2)