Huanran Chen

defense arXiv Aug 21, 2025 · Aug 2025

Chengcan Wu, Zeming Wei, Huanran Chen et al. · Peking University · Tsinghua University

Proposes irreversible hidden-state projections in LLMs to permanently erase harmful knowledge and resist adversarial relearning attacks

Transfer Learning Attack Prompt Injection nlp

Papers in Database (1)