ML Security Papers

Latest papers

5 papers

attack arXiv Feb 5, 2026 · 8w ago

BadTemplate: A Training-Free Backdoor Attack via Chat Template Against Large Language Models

IEEE Publication Technology · IEEE

Exploits LLM chat template configs to silently inject persistent malicious system-prompt instructions, achieving 100% backdoor success without retraining

AI Supply Chain Attacks Prompt Injection nlp

PDF

defense arXiv Jan 5, 2026 · Jan 2026

Towards Privacy-Preserving Mental Health Support with Large Language Models

Dong Xue, Jicheng Tu, Ming Wang et al. · IEEE

Defends mental health LLM training against membership inference attacks using federated LoRA fine-tuning and differential privacy optimization

Membership Inference Attack nlpfederated-learning

1 citations PDF Code

defense arXiv Dec 29, 2025 · Dec 2025

Zero-Trust Agentic Federated Learning for Secure IIoT Defense Systems

Samaresh Kumar Singh, Joyjit Roy, Martin So · IEEE

Defends federated learning IIoT intrusion detection against Byzantine poisoning using SHAP-weighted aggregation and on-device adversarial training

Data Poisoning Attack Input Manipulation Attack federated-learningtimeseries

PDF

defense arXiv Nov 22, 2025 · Nov 2025

Consolidating Diffusion-Generated Video Detection with Unified Multimodal Forgery Learning

Xiaohong Liu, Xiufeng Song, Huayu Zheng et al. · Shanghai Jiao Tong University · IEEE +2 more

Novel multimodal detector combining ViT spatio-temporal features and MLLM reasoning to identify diffusion-generated videos

Output Integrity Attack visionmultimodal

PDF

attack arXiv Jan 3, 2025 · Jan 2025

BLAST: A Stealthy Backdoor Leverage Attack against Cooperative Multi-Agent Deep Reinforcement Learning based Systems

Jing Fang, Saihao Yan, Xueyu Yin et al. · IEEE

Backdoor attack on multi-agent RL systems that compromises the entire team by trojaning a single agent via spatiotemporal triggers

Model Poisoning reinforcement-learning

6 citations PDF

Latest papers

BadTemplate: A Training-Free Backdoor Attack via Chat Template Against Large Language Models

Towards Privacy-Preserving Mental Health Support with Large Language Models

Zero-Trust Agentic Federated Learning for Secure IIoT Defense Systems

Consolidating Diffusion-Generated Video Detection with Unified Multimodal Forgery Learning

BLAST: A Stealthy Backdoor Leverage Attack against Cooperative Multi-Agent Deep Reinforcement Learning based Systems

Filters

Time Period

Paper Type

OWASP ML Top 10

OWASP LLM Top 10

Institution

Venue