Aashray Reddy

attack arXiv Nov 4, 2025 · Nov 2025

Aashray Reddy, Andrew Zagula, Nicholas Saban · Del Norte High School · University of California +1 more

AutoAdv automates multi-turn LLM jailbreaks via adaptive prompting, hitting 95% attack success rate on Llama-3.1-8B in six turns

Prompt Injection nlp

5 citations PDF

Papers in Database (1)