Ranjie Duan

attack arXiv Jan 9, 2025 · Jan 2025

Shiji Zhao, Ranjie Duan, Fengxiang Wang et al. · Beihang University · Alibaba Group

Exploits shuffle inconsistency in MLLMs to jailbreak GPT-4o and Claude-3.5-Sonnet via black-box text-image prompt manipulation

Prompt Injection multimodalnlp

attack arXiv Feb 26, 2026 · 5w ago

Xun Huang, Simeng Qin, Xiaoshuang Jia et al. · Nanyang Technological University · BraneMatrix AI +7 more

Bio-inspired optimization generates classical Chinese jailbreak prompts that defeat modern-language safety guardrails in black-box LLMs

Prompt Injection nlp

defense arXiv Mar 26, 2026 · 11d ago

Shiji Zhao, Shukun Xiong, Maoxun Yuan et al. · Beihang University · Alibaba Group +2 more

Adversarial training for infrared object detectors guided by thermal radiation physics to improve robustness against attacks and corruptions

Input Manipulation Attack vision

Papers in Database (3)