Shiyu Liang

attack arXiv Sep 25, 2025 · Sep 2025

Hanbo Huang, Yiran Zhang, Hao Zheng et al. · Shanghai Jiao Tong University · National University of Defense Technology

RL-based attack removes LLM text watermarks with 98.5% success using 100 training samples, defeating 10 watermarking schemes

Output Integrity Attack nlp

Papers in Database (1)