Murari Mandal

defense arXiv Sep 6, 2025 · Sep 2025

Debdeep Sanyal, Manodeep Ray, Murari Mandal · KIIT

Defends open-weight LLMs against malicious fine-tuning via bi-level adversarial training with a LoRA-generating hypernetwork adversary

Transfer Learning Attack Prompt Injection nlp

Papers in Database (1)