XiaoFeng Wang

defense arXiv Sep 29, 2025 · Sep 2025

A-MemGuard: A Proactive Defense Framework for LLM-Based Agent Memory

Qianshan Wei, Tengchao Yang, Yaochen Wang et al. · Nanyang Technological University · Independent Researcher +3 more

Defends LLM agent memory from indirect injection attacks using consensus-based validation and a dual-memory lesson structure

Prompt Injection Excessive Agency nlp

11 citations 2 influentialPDF Code

attack arXiv Dec 1, 2025 · Dec 2025

EmoRAG: Evaluating RAG Robustness to Symbolic Perturbations

Xinyun Zhou, Xinfeng Li, Yinan Peng et al. · Zhejiang University · Hengxin Technology +5 more

Emoticon injection into RAG queries poisons retrieval with ~100% success, exposing a critical LLM-integrated system vulnerability

Input Manipulation Attack Prompt Injection nlp

1 citations PDF

survey arXiv Feb 11, 2026 · 7w ago

The Landscape of Prompt Injection Threats in LLM Agents: From Taxonomy to Analysis

Peiran Wang, Xinfeng Li, Chong Xiang et al. · UCLA · NTU +1 more

Systematizes prompt injection attacks and defenses for LLM agents, introducing AgentPI benchmark that exposes context-dependent gaps in existing evaluations

Prompt Injection Excessive Agency nlp

PDF

defense arXiv Jan 8, 2026 · 12w ago

DP-MGTD: Privacy-Preserving Machine-Generated Text Detection via Adaptive Differentially Private Entity Sanitization

Lionel Z. Wang, Yusheng Zhao, Jiabin Luo et al. · Nanyang Technological University · The Hong Kong Polytechnic University +3 more

Privacy-preserving AI text detector using adaptive differential privacy entity sanitization that counter-intuitively boosts detection accuracy

Output Integrity Attack nlp

PDF

Papers in Database (4)

A-MemGuard: A Proactive Defense Framework for LLM-Based Agent Memory

EmoRAG: Evaluating RAG Robustness to Symbolic Perturbations

The Landscape of Prompt Injection Threats in LLM Agents: From Taxonomy to Analysis

DP-MGTD: Privacy-Preserving Machine-Generated Text Detection via Adaptive Differentially Private Entity Sanitization