ML Security Papers

ML Security Papers

Latest papers

1 papers

defense arXiv Jan 12, 2026 · 12w ago

Reward-Preserving Attacks For Robust Reinforcement Learning

Lucas Schott, Elies Gherbi, Hatem Hajri et al. · IRT SystemX · Sorbonne Université +2 more

Adaptive adversarial training for RL using reward-preserving attacks that calibrate perturbation strength to avoid making tasks unsolvable

Input Manipulation Attack reinforcement-learning