Rashmi Gangadharaiah

attack arXiv Sep 5, 2025 · Sep 2025

Disha Makhija, Manoj Ghuhan Arivazhagan, Vinayshekhar Bannihatti Kumar et al. · AWS AI Labs

White-box membership inference attack on LLMs using hidden states and attention patterns achieves AUC 0.85, surpassing output-based methods

Membership Inference Attack nlp

Papers in Database (1)