ML Security Papers

ML Security Papers

Latest papers

1 papers

attack arXiv Feb 3, 2026 · 8w ago

Phantom Transfer: Data-level Defences are Insufficient Against Data Poisoning

Andrew Draganov, Tolga H. Dur, Anandmayi Bhongade et al. · LASR Labs · Google DeepMind

Data poisoning attack that survives paraphrasing and filtering, planting password-triggered backdoors in LLMs including GPT-4.1

Data Poisoning Attack Model Poisoning nlp