Zhenyi Wang

defense arXiv Oct 31, 2025 · Oct 2025

Zixuan Hu, Li Shen, Zhenyi Wang et al. · Nanyang Technological University · Sun Yat-Sen University +2 more

Defends LLMs against harmful fine-tuning by learning data safety attributes via Bayesian inference without requiring attack simulation

Data Poisoning Attack Transfer Learning Attack Training Data Poisoning nlp

5 citations 1 influentialPDF Code

Papers in Database (1)