Le Yang

defense arXiv Jan 3, 2025 · Jan 2025

Spot Risks Before Speaking! Unraveling Safety Attention Heads in Large Vision-Language Models

Ziwei Zheng, Junyao Zhao, Le Yang et al. · Xi’an Jiaotong University

Discovers sparse safety attention heads in VLMs that detect malicious prompts, enabling a zero-shot jailbreak detector with minimal inference overhead

Prompt Injection multimodalvisionnlp

PDF Code

defense arXiv Aug 1, 2025 · Aug 2025

D3: Training-Free AI-Generated Video Detection Using Second-Order Features

Chende Zheng, Ruiqi suo, Chenhao Lin et al. · Xi’an Jiaotong University · Ltd. +1 more

Training-free AI-generated video detector exploiting second-order temporal feature divergence between real and synthetic videos

Output Integrity Attack visiongenerative

PDF Code

benchmark arXiv Apr 17, 2026 · 4w ago

TwoHamsters: Benchmarking Multi-Concept Compositional Unsafety in Text-to-Image Models

Chaoshuo Zhang, Yibo Liang, Mengke Tian et al. · Xi’an Jiaotong University · CISPA Helmholtz Center for Information Security

Benchmark evaluating compositional safety vulnerabilities in text-to-image models when benign concepts combine to create unsafe outputs

Input Manipulation Attack visiongenerative

PDF

Papers in Database (3)

Spot Risks Before Speaking! Unraveling Safety Attention Heads in Large Vision-Language Models

D3: Training-Free AI-Generated Video Detection Using Second-Order Features

TwoHamsters: Benchmarking Multi-Concept Compositional Unsafety in Text-to-Image Models