Long Bao Le

defense arXiv Apr 12, 2026 · 3d ago

Vu Tuan Truong, Long Bao Le · University of Quebec

Two-stage fine-tuning defense teaching LLMs critical thinking to detect and refuse malicious reasoning steps in backdoor attacks

Model Poisoning nlp

Papers in Database (1)