Yibo Yang

attack arXiv Jan 11, 2026 · 12w ago

Jinhan Liu, Yibo Yang, Ruiying Lu et al.

Positional decay reweighting boosts black-box membership inference on LLMs by amplifying high-entropy early token signals

Membership Inference Attack nlp

defense arXiv Jan 12, 2026 · 12w ago

Haozhong Wang, Zhuo Li, Yibo Yang et al. · Jilin University

Defends LLM safety alignment during fine-tuning via Optimal Transport-based distributional reweighting away from harmful data

Transfer Learning Attack Prompt Injection nlp

Papers in Database (2)