Yixuan Weng

defense arXiv Apr 29, 2026 · 22d ago

Yuan Xin, Yixuan Weng, Minjun Zhu et al. · CISPA · Westlake University +3 more

GAN-inspired co-evolutionary framework training attack generators and defenders to protect LLM review systems from hidden prompt injection

Prompt Injection nlp

defense arXiv Aug 3, 2025 · Aug 2025

Alva West, Yixuan Weng, Minjun Zhu et al. · Westlake University

Detects AI-generated text via wavelet-transformed token statistics, exploiting non-stationarity invisible to scalar-score detectors

Output Integrity Attack nlp

Papers in Database (2)