Haoran Li

attack EMNLP Oct 4, 2025 · Oct 2025

Yulin Chen, Haoran Li, Yuan Sui et al. · National University of Singapore · HKUST

Backdoor injected via SFT data poisoning makes LLMs execute injected instructions, defeating instruction hierarchy prompt injection defenses

Model Poisoning Prompt Injection nlp

1 citations PDF Code

Papers in Database (1)