ML Security Papers

Latest papers

2 papers

defense arXiv Feb 23, 2026 · 6w ago

Localized Concept Erasure in Text-to-Image Diffusion Models via High-Level Representation Misdirection

Uichan Lee, Jeonghyeon Kim, Sangheum Hwang · Seoul National University of Science and Technology

Defends T2I diffusion models against harmful content generation by misdirecting CLIP text encoder representations of target concepts at the high-level semantic layer

Prompt Injection generativevision

PDF Code

attack arXiv Jan 10, 2026 · 12w ago

Leveraging Soft Prompts for Privacy Attacks in Federated Prompt Tuning

Quan Minh Nguyen, Min-Seon Kim, Hoang M. Ngo et al. · University of Florida · North Carolina State University +2 more

PromptMIA: malicious server exploits adversarial soft prompt updates in federated prompt-tuning to infer client training membership

Membership Inference Attack Transfer Learning Attack nlpfederated-learning

PDF

Latest papers

Localized Concept Erasure in Text-to-Image Diffusion Models via High-Level Representation Misdirection

Leveraging Soft Prompts for Privacy Attacks in Federated Prompt Tuning

Filters

Time Period

Paper Type

OWASP ML Top 10

OWASP LLM Top 10

Institution

Venue