Tianyu Lu

benchmark arXiv Oct 8, 2025 · Oct 2025

Weidi Luo, Qiming Zhang, Tianyu Lu et al. · University of Georgia · University of Wisconsin–Madison +6 more

Benchmarks LLM-powered agents' ability to execute end-to-end enterprise intrusions aligned with MITRE ATT&CK TTPs

Excessive Agency Prompt Injection nlpmultimodal

4 citations PDF Code

attack arXiv Sep 28, 2025 · Sep 2025

Shuyi Lin, Tian Lu, Zikai Wang et al. · Northeastern University · Shanghai Jiao Tong University

Discovers five jailbreak failure modes in GPT-OSS-20B, introducing chain-oriented prompting and reasoning mirage attacks with 80% success rates

Prompt Injection nlp

Papers in Database (2)