Yatao Yang

defense arXiv Aug 3, 2025 · Aug 2025

Man Hu, Yahui Ding, Yatao Yang et al. · Beijing Electronic Science and Technology Institute · Nanyang Technological University

Defends language models against backdoor attacks via fine-grained feature detection and LoRA-based unlearning without full retraining

Model Poisoning nlp

Papers in Database (1)