Jie Zhang

defense arXiv Jan 27, 2026 · 9w ago

Contrastive Spectral Rectification: Test-Time Defense towards Zero-shot Adversarial Robustness of CLIP

Sen Nie, Jie Zhang, Zhuo Wang et al. · Chinese Academy of Sciences · University of Chinese Academy of Sciences +1 more

Test-time defense purifies adversarial inputs to CLIP using spectral-guided contrastive rectification, outperforming SOTA by 18.1% against AutoAttack

Input Manipulation Attack visionmultimodal

1 citations PDF Code

attack arXiv Nov 25, 2025 · Nov 2025

V-Attack: Targeting Disentangled Value Features for Controllable Adversarial Attacks on LVLMs

Sen Nie, Jie Zhang, Jianxin Yan et al. · Chinese Academy of Sciences · University of Chinese Academy of Sciences +1 more

Gradient-based adversarial image attack on VLMs exploiting disentangled transformer value features for precise semantic manipulation

Input Manipulation Attack Prompt Injection visionmultimodalnlp

1 citations PDF Code

defense arXiv Dec 16, 2025 · Dec 2025

Dual Attention Guided Defense Against Malicious Edits

Jie Zhang, Shuai Dong, Shiguang Shan et al. · Chinese Academy of Sciences · University of China Academy of Sciences +1 more

Defends images against malicious diffusion-model edits via dual adversarial perturbations targeting cross-attention maps and noise prediction

Output Integrity Attack visiongenerative

PDF

defense TPAMI Dec 16, 2025 · Dec 2025

Towards Transferable Defense Against Malicious Image Edits

Jie Zhang, Shuai Dong, Shiguang Shan et al. · Chinese Academy of Sciences · University of China Academy of Sciences +1 more

Proposes transferable adversarial perturbations via flat-minima optimization and dynamic text embedding to immunize images against malicious diffusion-based edits

Output Integrity Attack visiongenerative

PDF

defense arXiv Dec 16, 2025 · Dec 2025

Semantic Mismatch and Perceptual Degradation: A New Perspective on Image Editing Immunity

Shuai Dong, Jie Zhang, Guoying Zhao et al. · China University of Geosciences · Chinese Academy of Sciences +2 more

Defends images from unauthorized diffusion model editing via adversarial intermediate feature perturbations that disrupt semantic and perceptual output quality

Output Integrity Attack visiongenerative

PDF

defense arXiv Nov 29, 2025 · Nov 2025

Assimilation Matters: Model-level Backdoor Detection in Vision-Language Pretrained Models

Zhongqi Wang, Jie Zhang, Shiguang Shan et al. · Chinese Academy of Sciences · University of Chinese Academy of Sciences

Detects backdoors in CLIP-style text encoders via feature assimilation analysis and gradient-based token inversion, no prior knowledge required

Model Poisoning visionnlpmultimodal

PDF Code

Papers in Database (6)

Contrastive Spectral Rectification: Test-Time Defense towards Zero-shot Adversarial Robustness of CLIP

V-Attack: Targeting Disentangled Value Features for Controllable Adversarial Attacks on LVLMs

Dual Attention Guided Defense Against Malicious Edits

Towards Transferable Defense Against Malicious Image Edits

Semantic Mismatch and Perceptual Degradation: A New Perspective on Image Editing Immunity

Assimilation Matters: Model-level Backdoor Detection in Vision-Language Pretrained Models