Zhaoxin Wang

defense arXiv Mar 23, 2026 · 14d ago

DTVI: Dual-Stage Textual and Visual Intervention for Safe Text-to-Image Generation

Binhong Tan, Zhaoxin Wang, Handing Wang · Xidian University

Dual-stage defense blocking unsafe image generation via sequence-level prompt intervention and visual-stage filtering across multiple harmful categories

Input Manipulation Attack Prompt Injection visionnlpmultimodalgenerative

PDF

defense arXiv Feb 26, 2026 · 5w ago

Multilingual Safety Alignment Via Sparse Weight Editing

Jiaming Liang, Zhaoxin Wang, Handing Wang · Xidian University

Training-free sparse weight editing transfers LLM safety alignment from high-resource to low-resource languages to block cross-lingual jailbreaks

Prompt Injection nlp

PDF

Papers in Database (2)

DTVI: Dual-Stage Textual and Visual Intervention for Safe Text-to-Image Generation

Multilingual Safety Alignment Via Sparse Weight Editing