Guobin Shen

defense arXiv Aug 8, 2025 · Aug 2025

Bing Han, Feifei Zhao, Dongcheng Zhao et al. · University of Chinese Academy of Sciences · Chinese Academy of Sciences +2 more

Training-free post-fine-tuning defense restoring LLM safety alignment via sparse neuron projection without retraining

Transfer Learning Attack Prompt Injection nlp

Papers in Database (1)