Simone Sestito

defense arXiv Oct 2, 2025 · Oct 2025

Davide Gabrielli, Simone Sestito, Iacopo Masi · Sapienza University of Rome

Defends LLMs against adversarial perturbations and unsafe triggers by inverting model outputs to expose attack inputs

Input Manipulation Attack Prompt Injection nlp

Papers in Database (1)