Kehuan Zhang

defense arXiv Dec 5, 2025 · Dec 2025

ARGUS: Defending Against Multimodal Indirect Prompt Injection via Steering Instruction-Following Behavior

Weikai Lu, Ziqian Zeng, Kehua Zhang et al. · South China University of Technology · Hong Kong University of Science and Technology +2 more

Defends MLLMs against multimodal indirect prompt injection by steering instruction-following behavior in activation space

Prompt Injection multimodalnlp

1 citations PDF

attack arXiv Nov 10, 2025 · Nov 2025

Breaking the Stealth-Potency Trade-off in Clean-Image Backdoors with Generative Trigger Optimization

Binyan Xu, Fan Yang, Di Tang et al. · The Chinese University of Hong Kong · Sun Yat-Sen University +1 more

GCB uses conditional InfoGAN to craft clean-image backdoors via label-only poisoning, breaking the stealth-potency trade-off with under 1% accuracy drop

Model Poisoning Data Poisoning Attack vision

1 citations PDF

defense arXiv Jan 27, 2026 · 9w ago

From Internal Diagnosis to External Auditing: A VLM-Driven Paradigm for Online Test-Time Backdoor Defense

Binyan Xu, Fan Yang, Xilin Dai et al. · The Chinese University of Hong Kong · Zhejiang University +1 more

Defends backdoored vision models at test-time using VLMs as external semantic auditors decoupled from victim model parameters

Model Poisoning vision

PDF

Papers in Database (3)

ARGUS: Defending Against Multimodal Indirect Prompt Injection via Steering Instruction-Following Behavior

Breaking the Stealth-Potency Trade-off in Clean-Image Backdoors with Generative Trigger Optimization

From Internal Diagnosis to External Auditing: A VLM-Driven Paradigm for Online Test-Time Backdoor Defense