ML Security Papers

Latest papers

2 papers

benchmark arXiv Feb 14, 2026 · 7w ago

Xiao Ren, Xinyi Yu, Linkang Du et al. · Zhejiang University · Xi'an Jiaotong University +1 more

Benchmarks 25 dataset watermarking methods for copyright auditing across classification and generation tasks with new evaluation metrics

Output Integrity Attack vision

attack arXiv Jan 19, 2026 · 11w ago

Murat Bilgehan Ertan, Emirhan Böge, Min Chen et al. · Centrum Wiskunde & Informatica · Vrije Universiteit Amsterdam +2 more

SAGE paraphrasing framework defeats membership inference attacks on LLMs by rewriting training data to preserve semantics but evade MIA signals

Membership Inference Attack nlp