ML Security Papers

Latest papers

2 papers

defense arXiv Mar 19, 2026 · 18d ago

Md Takrim Ul Alam, Akif Islam, Mohd Ruhul Ameen et al. · University of Rajshahi · Marshall University +1 more

Runtime middleware defense against prompt injection using hierarchical prompt segmentation and three-stage policy enforcement for LLM APIs

Prompt Injection nlp

attack arXiv Aug 25, 2025 · Aug 2025

Zhuotao Lian, Weiyu Wang, Qingkui Zeng et al. · Hiroshima University · Hosei University +2 more

Demonstrates indirect prompt injection by embedding adversarial instructions in uploaded documents, hijacking LLM outputs across 7 major platforms

Prompt Injection Sensitive Information Disclosure nlp