Tongliang Liu

attack arXiv Sep 25, 2025 · Sep 2025

FORCE: Transferable Visual Jailbreaking Attacks via Feature Over-Reliance CorrEction

Runqi Lin, Alasdair Paren, Suqin Yuan et al. · The University of Sydney · University of Oxford

Improves transferability of adversarial visual jailbreaks against closed-source MLLMs via loss landscape flattening and feature over-reliance correction

Input Manipulation Attack Prompt Injection visionmultimodalnlp

6 citations PDF

attack arXiv Feb 24, 2026 · 5w ago

VII: Visual Instruction Injection for Jailbreaking Image-to-Video Generation Models

Bowen Zheng, Yongli Xiang, Ziming Hong et al. · Huazhong University of Science and Technology · The University of Sydney

Jailbreaks commercial I2V video generation models by embedding malicious visual instructions into reference images, bypassing safety filters at 83.5% success rate

Input Manipulation Attack Prompt Injection multimodalgenerativevision

3 citations PDF

defense TPAMI Jan 27, 2026 · 9w ago

Privacy-Preserving Model Transcription with Differentially Private Synthetic Distillation

Bochao Liu, Shiming Ge, Pengju Wang et al. · Chinese Academy of Sciences · Beijing Institute of Astronautical Systems Engineering +1 more

Defends against model inversion by converting trained models to DP-guaranteed equivalents via data-free synthetic distillation without accessing private training data

Model Inversion Attack vision

PDF

Papers in Database (3)

FORCE: Transferable Visual Jailbreaking Attacks via Feature Over-Reliance CorrEction

VII: Visual Instruction Injection for Jailbreaking Image-to-Video Generation Models

Privacy-Preserving Model Transcription with Differentially Private Synthetic Distillation