ML Security Papers

Latest papers

5 papers

defense arXiv Mar 11, 2026 · 26d ago

Panagiotis Georgios Pennas, Konstantinos Papaioannou, Marco Guarnieri et al. · IMDEA Software Institute · Universidad Politécnica de Madrid

Defends multi-tenant LLM servers against KV cache timing side channels that let attackers reconstruct other users' prompts

Sensitive Information Disclosure nlp

defense arXiv Dec 3, 2025 · Dec 2025

Alejandro Cobo, Roberto Valle, José Miguel Buenaposada et al. · Universidad Politécnica de Madrid · Universidad Rey Juan Carlos

Trains deepfake video detectors on synthetic kinematic inconsistencies that violate natural facial motion correlations for generalizable detection

Output Integrity Attack vision

defense arXiv Nov 20, 2025 · Nov 2025

Jaime Álvarez Urueña, David Camacho, Javier Huertas Tato · Universidad Politécnica de Madrid

Few-shot AI-generated image detector using supervised contrastive embeddings and k-NN, generalizing to unseen generators with 91.3% accuracy

Output Integrity Attack visiongenerative

survey Journal of Medical Internet Re... Nov 14, 2025 · Nov 2025

Farhad Abtahi, Fernando Seoane, Iván Pau et al. · Karolinska Institutet · KTH Royal Institute of Technology +3 more

Surveys data poisoning vulnerabilities across healthcare AI — CNNs, LLMs, RL, and federated learning — with 60%+ attack success using 100–500 samples

Data Poisoning Attack AI Supply Chain Attacks Training Data Poisoning visionnlpreinforcement-learningfederated-learning

1 citations PDF

benchmark arXiv Oct 28, 2025 · Oct 2025

Antoine Szatkownik, Aurélien Decelle, Beatriz Seoane et al. · Université Paris-Saclay · Universidad Complutense de Madrid +2 more

Proposes PRIVET, a sample-level metric using extreme value theory to detect training data memorization in generative models

Model Inversion Attack visiongenerative