Subramanyam Sahoo

defense arXiv Dec 15, 2025 · Dec 2025

Subramanyam Sahoo · UC Berkeley

Defends against backdoored code-generating LLMs by checking execution trace consistency across semantically equivalent program variants

Model Poisoning nlp

benchmark arXiv Dec 25, 2025 · Dec 2025

Subramanyam Sahoo, Jared Junkin · University of California · Johns Hopkins University

Interprets deepfake detector internals using sparse autoencoders and forensic manifold analysis on a 2B-parameter VLM

Output Integrity Attack visionmultimodal

Papers in Database (2)