ML Security Papers

ML Security Papers

Latest papers

1 papers

attack arXiv Jan 27, 2026 · 10w ago

What Hard Tokens Reveal: Exploiting Low-confidence Tokens for Membership Inference Attacks against Large Language Models

Md Tasnim Jawad, Mingyan Xiao, Yanzhao Wu · Florida International University · California State Polytechnic University

Novel token-level MIA on LLMs exploiting hard-token probability gaps between fine-tuned and reference models to outperform 7 baselines

Membership Inference Attack nlp