Siyuan Liang

defense arXiv Sep 24, 2025 · Sep 2025

SafeSteer: Adaptive Subspace Steering for Efficient Jailbreak Defense in Vision-Language Models

Xiyu Zeng, Siyuan Liang, Liming Lu et al. · Nanjing University of Science and Technology · Nanyang Technological University +1 more

Inference-time SVD-based activation steering defends VLMs against visual jailbreaks while preserving utility and efficiency

Input Manipulation Attack Prompt Injection visionnlpmultimodal

1 citations PDF

attack arXiv Feb 19, 2026 · 6w ago

BadCLIP++: Stealthy and Persistent Backdoors in Multimodal Contrastive Learning

Siyuan Liang, Yongcheng Jing, Yingjie Wang et al. · Nanyang Technological University · National University of Singapore

Stealthy, persistent backdoor attack on CLIP models achieving 99.99% ASR at 0.3% poisoning, robust against 19 defenses

Model Poisoning multimodalvision

PDF

defense arXiv Sep 25, 2025 · Sep 2025

FERD: Fairness-Enhanced Data-Free Robustness Distillation

Zhengxiao Li, Liming Lu, Xu Zheng et al. · Nanjing University of Science and Technology · HKUST(GZ) +3 more

Fairness-enhanced data-free distillation reduces per-class adversarial robustness disparity in student models via reweighted synthetic adversarial examples

Input Manipulation Attack vision

PDF

Papers in Database (3)

SafeSteer: Adaptive Subspace Steering for Efficient Jailbreak Defense in Vision-Language Models

BadCLIP++: Stealthy and Persistent Backdoors in Multimodal Contrastive Learning

FERD: Fairness-Enhanced Data-Free Robustness Distillation