Li Wang

attack arXiv Mar 24, 2026 · 13d ago

Wenyu Chen, Xiangtao Meng, Chuanchao Zang et al. · Shandong University

Token-aware jailbreak fuzzing that achieves 90% attack success with 70% fewer queries by prioritizing high-contribution tokens

Prompt Injection nlp

defense arXiv Aug 28, 2025 · Aug 2025

Xiangtao Meng, Yingkai Dong, Ning Yu et al. · Shandong University · Netflix

Proposes SafePatch, an external safety module for T2I diffusion models that suppresses unsafe generation without degrading benign image quality

Prompt Injection visiongenerative

Papers in Database (2)