ML Security Papers

ML Security Papers

Latest papers

1 papers

defense arXiv Aug 28, 2025 · Aug 2025

Beyond the Safety Tax: Mitigating Unsafe Text-to-Image Generation via External Safety Rectification

Xiangtao Meng, Yingkai Dong, Ning Yu et al. · Shandong University · Netflix

Proposes SafePatch, an external safety module for T2I diffusion models that suppresses unsafe generation without degrading benign image quality

Prompt Injection visiongenerative