ML Security Papers

ML Security Papers

Latest papers

1 papers

defense arXiv Nov 10, 2025 · Nov 2025

SAFENLIDB: A Privacy-Preserving Safety Alignment Framework for LLM-based Natural Language Database Interfaces

Ruiheng Liu, XiaoBing Chen, Jinyu Zhang et al. · Xi’an Research Institute of High-Tech · Harbin Institute of Technology

Aligns LLMs against multi-turn inference-based database exfiltration attacks via chain-of-thought synthesis and alternating DPO

Sensitive Information Disclosure Prompt Injection nlp