Ya Jiang

defense arXiv Jan 29, 2026 · 9w ago

Ya Jiang, Massieh Kordi Boroujeny, Surender Suresh Kumar et al. · George Mason University

Distortion-free multi-bit LLM output watermark achieving 8-12% higher bit accuracy than prior methods with no text quality degradation

Output Integrity Attack nlp

attack arXiv Jan 6, 2026 · Jan 2026

Xiangdong Hu, Yangyang Jiang, Qin Hu et al. · Georgia State University · Nanyang Technological University

Gamified jailbreak uses competitive game framing and image shuffling to bypass MLLM safety alignment, hitting 92% ASR on Gemini 2.5 Flash

Prompt Injection multimodalnlpvision

Papers in Database (2)