Jingqi Zhang

defense arXiv Oct 3, 2025 · Oct 2025

Jingqi Zhang, Ruibo Chen, Yingqing Yang et al. · National University of Singapore · University of Maryland +2 more

Watermarks LLM fine-tuning datasets with distortion-free signals to enable black-box detection of copyrighted dataset usage

Output Integrity Attack nlp

5 citations PDF Code

attack arXiv Nov 19, 2025 · Nov 2025

Haodong Li, Jingqi Zhang, Xiao Cheng et al. · Huazhong University of Science and Technology · National University of Singapore +1 more

Novel membership inference framework exploiting LLM overconfidence and uncertainty signals to detect copyrighted training data

Membership Inference Attack nlp

defense arXiv Feb 12, 2026 · 7w ago

Ruibo Chen, Yihan Wu, Xuehao Cui et al. · University of Maryland · National University of Singapore

Proposes weaker single-layer watermarks in LLM ensembles to preserve entropy and improve AI-generated text detectability

Output Integrity Attack nlp

Papers in Database (3)