Evangelos E. Papalexakis

defense arXiv Aug 5, 2025 · Aug 2025

Sri Durga Sai Sowmya Kadali, Evangelos E. Papalexakis · University of California

Detects LLM jailbreak prompts via co-occurrence tensor decomposition, achieving F1=0.83 with only 0.5% labeled data

Prompt Injection nlp

defense arXiv Sep 19, 2025 · Sep 2025

Het Patel, Muzammil Allie, Qian Zhang et al. · University of California

Plug-and-play tensor decomposition defense filters adversarial perturbations from VLM vision encoders without retraining

Input Manipulation Attack visionmultimodal

Papers in Database (2)