Trung Cuong Dang

benchmark arXiv Nov 25, 2025 · Nov 2025

Trung Cuong Dang, David Mohaisen · University of Central Florida

Defines LLM training data memorization by number of distinct adversarial prefixes that elicit it, enabling robust leakage auditing of aligned models

Model Inversion Attack Sensitive Information Disclosure nlp

2 citations PDF

Papers in Database (1)