ML Security Papers

Latest papers

5 papers

attack arXiv Apr 7, 2026 · 6w ago

Yanxu Mao, Peipei Liu, Tiehan Cui et al. · Henan University · Chinese Academy of Sciences +2 more

Red-teams LLM agents by hijacking reasoning trajectories and memory retrieval without modifying user prompts, achieving cross-model jailbreaks

Prompt Injection Excessive Agency nlpmultimodal

defense arXiv Jan 7, 2026 · Jan 2026

Yakun Niu, Yingjian Chen, Lei Zhang · Henan University

Fine-tunes CLIP-ViT with texture-aware masking to detect AI-generated images by exposing distributional deviations from real imagery

Output Integrity Attack visiongenerative

1 citations PDF

survey arXiv Oct 23, 2025 · Oct 2025

Wu Yichao, Wang Yirui, Ding Panpan et al. · Henan University · Henan Industrial Technology Academy of Spatio-Temporal Big Data

Surveys adversarial attacks and defenses in deep RL, classifying threats by perturbation type across state, action, reward, and model spaces

Input Manipulation Attack Model Skewing Model Poisoning reinforcement-learning

2 citations PDF

attack arXiv Sep 9, 2025 · Sep 2025

Chun Liu, Hailong Wang, Bingqian Zhu et al. · Henan University · Beihang University

Transferable black-box adversarial attack on remote sensing classifiers via local image mixing and adapted logit loss optimization

Input Manipulation Attack vision

attack arXiv Aug 29, 2025 · Aug 2025

Chun Liu, Panpan Ding, Zheng Zheng et al. · Henan University · Beihang University

Adversarial patch attack for ship detection using localized augmentation to improve black-box transferability on remote sensing imagery

Input Manipulation Attack vision