Haoyu Li

defense arXiv Jan 7, 2026 · 12w ago

HoneyTrap: Deceiving Large Language Model Attackers to Honeypot Traps with Resilient Multi-Agent Defense

Siyuan Li, Xi Lin, Jun Wu et al. · Shanghai Jiao Tong University · University of Illinois at Urbana-Champaign +1 more

Deceptive multi-agent defense that lures LLM jailbreak attackers into honeypot traps, reducing attack success by 68.77% while draining attacker resources

Prompt Injection nlp

PDF

Papers in Database (1)

HoneyTrap: Deceiving Large Language Model Attackers to Honeypot Traps with Resilient Multi-Agent Defense