fix ut issue

Signed-off-by: Mengni Wang <[email protected]>
mengniwang95 · Jun 27, 2024 · ecbb392 · ecbb392
1 parent c011617
commit ecbb392
Showing 1 changed file with 3 additions and 0 deletions.
diff --git a/onnx_neural_compressor/quantization/matmul_4bits_quantizer.py b/onnx_neural_compressor/quantization/matmul_4bits_quantizer.py
@@ -15,6 +15,7 @@
 from typing import List, Union  # isort: skip
 
 import onnx
+import onnxruntime as ort
 
 from onnx_neural_compressor.quantization import matmul_nbits_quantizer
 
@@ -34,6 +35,7 @@ def __init__(
         nodes_to_exclude=None,
         algo_config: matmul_nbits_quantizer.WeightOnlyQuantConfig = None,
         providers: List[str] = ["CPUExecutionProvider"],
+        optimization_level: ort.GraphOptimizationLevel = ort.GraphOptimizationLevel.ORT_ENABLE_BASIC,
     ):
         super().__init__(
             model=model,
@@ -44,4 +46,5 @@ def __init__(
             algo_config=algo_config,
             n_bits=4,
             providers=providers,
+            optimization_level=optimization_level,
         )