ML Security Papers

Latest papers

8 papers

attack arXiv Feb 18, 2026 · 6w ago

Vulnerability Analysis of Safe Reinforcement Learning via Inverse Constrained Reinforcement Learning

Jialiang Fan, Shixiong Jiang, Mengyu Liu et al. · University of Notre Dame · Washington State University

Black-box adversarial attack on Safe RL policies using inverse constrained RL to induce safety violations without victim gradient access

Input Manipulation Attack reinforcement-learning

PDF

defense arXiv Feb 13, 2026 · 7w ago

SecureGate: Learning When to Reveal PII Safely via Token-Gated Dual-Adapters for Federated LLMs

Mohamed Shaaban, Mohamed Elmahallawy · Washington State University

Dual-adapter LoRA framework for federated LLMs that blocks PII extraction and inference attacks via token-gated access control

Model Inversion Attack Sensitive Information Disclosure nlpfederated-learning

PDF

attack arXiv Jan 10, 2026 · 12w ago

Leveraging Soft Prompts for Privacy Attacks in Federated Prompt Tuning

Quan Minh Nguyen, Min-Seon Kim, Hoang M. Ngo et al. · University of Florida · North Carolina State University +2 more

PromptMIA: malicious server exploits adversarial soft prompt updates in federated prompt-tuning to infer client training membership

Membership Inference Attack Transfer Learning Attack nlpfederated-learning

PDF

benchmark arXiv Jan 2, 2026 · Jan 2026

A Comprehensive Dataset for Human vs. AI Generated Image Detection

Rajarshi Roy, Nasrin Imanpour, Ashhar Aziz et al. · Kalyani Government Engineering College · AI Institute USC +12 more

Releases MS COCOAI, a 96K-image benchmark for detecting AI-generated images and attributing them to specific generative models

Output Integrity Attack visiongenerative

1 citations PDF Code

defense arXiv Dec 9, 2025 · Dec 2025

Decentralized Trust for Space AI: Blockchain-Based Federated Learning Across Multi-Vendor LEO Satellite Networks

Mohamed Elmahallawy, Asma Jodeiri Akbarfam · Washington State University

Blockchain-backed federated satellite learning framework that blocks Byzantine/poisoned model updates across multi-vendor LEO constellations

Data Poisoning Attack federated-learning

PDF Code

defense BigData Congress Dec 9, 2025 · Dec 2025

Secure and Privacy-Preserving Federated Learning for Next-Generation Underground Mine Safety

Mohamed Elmahallawy, Sanjay Madria, Samuel Frimpong · Washington State University · Missouri University of Science and Technology

Defends FL in underground mining against gradient inversion and membership inference attacks using Decentralized Functional Encryption

Model Inversion Attack Membership Inference Attack federated-learningtimeseries

PDF

defense arXiv Aug 19, 2025 · Aug 2025

When Secure Aggregation Falls Short: Achieving Long-Term Privacy in Asynchronous Federated Learning for LEO Satellite Networks

Mohamed Elmahallawy, Tie Luo · Washington State University · University of Kentucky

Defends federated learning in satellite networks against cross-round model inversion by enforcing joint satellite participation across rounds

Model Inversion Attack federated-learning

PDF

defense arXiv Aug 13, 2025 · Aug 2025

Detecting Untargeted Attacks and Mitigating Unreliable Updates in Federated Learning for Underground Mining Operations

Md Sazedur Rahman, Mohamed Elmahallawy, Sanjay Madria et al. · Missouri University of Science and Technology · Washington State University

Defends federated learning against Byzantine sign-flipping and additive noise attacks in underground mining sensor networks

Data Poisoning Attack federated-learningtimeseries

PDF Code

Latest papers

Vulnerability Analysis of Safe Reinforcement Learning via Inverse Constrained Reinforcement Learning

SecureGate: Learning When to Reveal PII Safely via Token-Gated Dual-Adapters for Federated LLMs

Leveraging Soft Prompts for Privacy Attacks in Federated Prompt Tuning

A Comprehensive Dataset for Human vs. AI Generated Image Detection

Decentralized Trust for Space AI: Blockchain-Based Federated Learning Across Multi-Vendor LEO Satellite Networks

Secure and Privacy-Preserving Federated Learning for Next-Generation Underground Mine Safety

When Secure Aggregation Falls Short: Achieving Long-Term Privacy in Asynchronous Federated Learning for LEO Satellite Networks

Detecting Untargeted Attacks and Mitigating Unreliable Updates in Federated Learning for Underground Mining Operations

Filters

Time Period

Paper Type

OWASP ML Top 10

OWASP LLM Top 10

Institution

Venue