Sujuan Qin

attack arXiv Jan 22, 2026 · 10w ago

Beyond Visual Safety: Jailbreaking Multimodal Large Language Models for Harmful Image Generation via Semantic-Agnostic Inputs

Mingyu Yu, Lana Liu, Zhehao Zhao et al. · Beijing University of Posts and Telecommunications

Jailbreaks multimodal LLMs into generating harmful images via semantic-agnostic visual splicing and inductive text recomposition, achieving 98% success on GPT-5

Input Manipulation Attack Prompt Injection visionnlpmultimodal

PDF Code

Papers in Database (1)

Beyond Visual Safety: Jailbreaking Multimodal Large Language Models for Harmful Image Generation via Semantic-Agnostic Inputs