Distributionally Robust Safety Verification of Neural Networks via Worst-Case CVaR

Ensuring the safety of neural networks under input uncertainty is a fundamental challenge in safety-critical applications. This paper builds on and expands Fazlyab's quadratic-constraint (QC) and semidefinite-programming (SDP) framework for neural network verification to a distributionally robust and tail-risk-aware setting by integrating worst-case Conditional Value-at-Risk (WC-CVaR) over a moment-based ambiguity set with fixed mean and covariance. The resulting conditions remain SDP-checkable and explicitly account for tail risk. This integration broadens input-uncertainty geometry-covering ellipsoids, polytopes, and hyperplanes-and extends applicability to safety-critical domains where tail-event severity matters. Applications to closed-loop reachability of control systems and classification are demonstrated through numerical experiments, illustrating how the risk level $\varepsilon$ trades conservatism for tolerance to tail events-while preserving the computational structure of prior QC/SDP methods for neural network verification and robustness analysis.

Key Contributions

Extends Fazlyab's QC/SDP neural network verification framework to incorporate Worst-Case Conditional Value-at-Risk (WC-CVaR) over a moment-based distributional ambiguity set
Derives SDP-checkable safety conditions that explicitly account for tail risk, broadening input-uncertainty geometry to ellipsoids, polytopes, and hyperplanes
Establishes a formal equivalence between WC-CVaR and confidence-ellipsoid methods on special ellipsoidal sets, with numerical validation on closed-loop reachability and classification tasks

🛡️ Threat Analysis

Input Manipulation Attack

Proposes a certified robustness / safety verification method for neural networks under input perturbation — extending QC/SDP-based robustness analysis (a known ML01 defense technique) with distributionally robust WC-CVaR to provide formal safety certificates against worst-case tail-event inputs.

Details

Model Types

cnn

Threat Tags

white_boxinference_time

Applications

2025 0 cit.

Input Manipulation Attack

70%

Distributionally Robust Safety Verification of Neural Networks via Worst-Case CVaR

Key Contributions

🛡️ Threat Analysis

Details

Similar Papers

Algebraic Robustness Verification of Neural Networks

Lipschitz-aware Linearity Grafting for Certified Robustness

CIARD: Cyclic Iterative Adversarial Robustness Distillation

Clip-and-Verify: Linear Constraint-Driven Domain Clipping for Accelerating Neural Network Verification

Sample-wise Adaptive Weighting for Transfer Consistency in Adversarial Distillation

Learning Better Certified Models from Empirically-Robust Teachers

DeepProv: Behavioral Characterization and Repair of Neural Networks via Inference Provenance Graph Analysis

Ensuring Calibration Robustness in Split Conformal Prediction Under Adversarial Attacks