Francesco Casucci

benchmark arXiv Oct 26, 2025 · Oct 2025

Julia Bazinska, Max Mathys, Francesco Casucci et al. · Lakera AI · ETH Zürich +2 more

Benchmarks 34 backbone LLMs against 194K crowdsourced adversarial attacks using a threat-snapshot framework for AI agent security

Prompt Injection Excessive Agency nlp

1 citations PDF

Papers in Database (1)