Xiaoyan Zhang

defense arXiv Aug 24, 2025 · Aug 2025

Xiaoyan Zhang, Dongyang Lyu, Xiaoqi Li · Hainan University

Hierarchical LLM defense framework combining BERT-CRF input filtering, adversarial training, and neural output watermarking to detect jailbreaks

Output Integrity Attack Prompt Injection nlp

Papers in Database (1)