Olivera Kotevska

attack arXiv Mar 19, 2026 · 9w ago

Toan Tran, Olivera Kotevska, Li Xiong · Emory University · Oak Ridge National Laboratory

LLM-agent framework that automatically discovers novel membership inference attack strategies, achieving 0.18 AUC improvement over existing MIAs

Membership Inference Attack Vulnerability Discovery Red-Team Agents

defense arXiv Apr 1, 2026 · 7w ago

Zikai Zhang, Rui Hu, Olivera Kotevska et al. · University of Nevada · Oak Ridge National Laboratory

Detects LLM jailbreak attacks using logit distributions over numerical tokens, achieving 22.66% ASR reduction with minimal overhead

Prompt Injection nlp

defense arXiv Apr 6, 2026 · 6w ago

Jiahao Xu, Rui Hu, Olivera Kotevska et al. · University of Nevada · Oak Ridge National Laboratory

Multi-bit watermarking embedding binary messages in LLM text for attribution using cross-permutation green lists

Output Integrity Attack nlp

Papers in Database (3)