Francis Kulumba

benchmark arXiv Feb 11, 2026 · 7w ago

Théo Lasnier, Wissam Antoun, Francis Kulumba et al. · Inria Paris

Mechanistic analysis reveals LLM backdoor triggers hijack existing language-encoding circuits rather than forming isolated hidden pathways

Model Poisoning nlp

Papers in Database (1)