Guorui Chen

defense EMNLP Nov 1, 2025 · Nov 2025

Yifan Xia, Guorui Chen, Wenqian Yu et al. · Wuhan University · University of Oxford

Defends MLLMs against jailbreaks and over-refusal by optimizing an adversarial-style image prompt as a parameter-free safety alignment mechanism

Input Manipulation Attack Prompt Injection nlpmultimodalvision

2 citations 1 influentialPDF Code

Papers in Database (1)