Hyesoo Hong

defense arXiv Sep 27, 2025 · Sep 2025

Wonje Jeung, Sangyeon Yoon, Yoonjun Cho et al. · Yonsei University

Token-level safety alignment for diffusion LLMs that blocks any-order jailbreaks and prefilling attacks, cutting DIJA success from 80% to near-zero

Prompt Injection nlpgenerative

2 citations PDF

Papers in Database (1)