Giulio Zizzo

benchmark arXiv Jan 14, 2026 · 11w ago

Blue Teaming Function-Calling Agents

Greta Dolcetti, Giulio Zizzo, Sergio Maffeis · Ca’ Foscari University of Venice · IBM Research +1 more

Benchmarks prompt injection and tool poisoning attacks against four open-source function-calling LLMs alongside eight defenses, finding none production-ready

Prompt Injection Insecure Plugin Design nlp

PDF

Papers in Database (1)

Blue Teaming Function-Calling Agents