Zeming Wei

defense arXiv Oct 22, 2025 · Oct 2025

Chengcan Wu, Zhixin Zhang, Mingqian Xu et al. · Peking University

Dynamic graph-monitoring defense disrupts malicious inter-agent communications in LLM multi-agent systems via continuous node evaluation

Prompt Injection Excessive Agency nlpgraph

2 citations PDF Code

benchmark arXiv Feb 2, 2026 · 9w ago

Zeming Wei, Zhixin Zhang, Chengcan Wu et al. · Peking University

Coverage criteria framework using LLM internal representations to evaluate jailbreak test suite adequacy and guide attack prompt sampling

Prompt Injection nlp

defense arXiv Nov 15, 2025 · Nov 2025

Rui Wang, Zeming Wei, Xiyue Zhang et al. · Peking University · University of Bristol

Defends DNNs against unseen adversarial attacks by dynamically sampling attack types via multi-armed bandit adversarial training

Input Manipulation Attack vision

Papers in Database (3)