Zhengxing Li

defense arXiv Sep 19, 2025 · Sep 2025

Zhengxing Li, Guangmingmei Yang, Jayaram Raghuram et al. · Penn State · Anomalee Inc.

Defends LLMs against backdoor attacks by inverting triggers via discrete greedy search and implicit activation-space blacklisting

Model Poisoning nlp

Papers in Database (1)