Re-quantize models in FP16 in keep positional encoding in FP32 to avoid bad accuracy

Files changed (5) hide show

convert_to_fp16.py CHANGED Viewed

@@ -2,6 +2,8 @@ import argparse
 from onnxmltools.utils.float16_converter import convert_float_to_float16
 from onnxmltools.utils import load_model, save_model
 def main():
     # Set up an argument parser
     parser = argparse.ArgumentParser(description='Convert ONNX model from Float32 to Float16.')
@@ -17,7 +19,7 @@ def main():
     # Convert model from Float32 to Float16
     print("Converting model...")
-    new_onnx_model = convert_float_to_float16(onnx_model, min_positive_val=1e-7, max_finite_val=1e4, keep_io_types=True)
     # Save the converted model
     print(f"Saving converted model to {args.output_model}")

 from onnxmltools.utils.float16_converter import convert_float_to_float16
 from onnxmltools.utils import load_model, save_model
+node_block_list = ['Sin_689', 'MatMul_694', 'MatMul_698', 'Clip_699', 'Clip_700', 'Sub_702', 'Sub_704']
 def main():
     # Set up an argument parser
     parser = argparse.ArgumentParser(description='Convert ONNX model from Float32 to Float16.')
     # Convert model from Float32 to Float16
     print("Converting model...")
+    new_onnx_model = convert_float_to_float16(onnx_model, min_positive_val=1e-7, max_finite_val=1e4, keep_io_types=True, node_block_list=node_block_list)
     # Save the converted model
     print(f"Saving converted model to {args.output_model}")

rtmo-l.fp16.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:955c0c6566c46b8c720cdd822bda8d647827fa7d76e89371cc7f287e392a72ed
-size 88025438

 version https://git-lfs.github.com/spec/v1
+oid sha256:94010d0d62a79c87e7dd3fdf74395f6ed4e73918e4fc8ee3de94d90051dcc160
+size 88025578

rtmo-m.fp16.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:908b45cc80feb94e9abbfc1c3254db53da1c4853a8e70e2985c5d10d1a06cf74
-size 44703294

 version https://git-lfs.github.com/spec/v1
+oid sha256:0413fa25c7796c3f1ed97ee92069192a5e923a7422aedb2291bcab96042ee184
+size 44703434

rtmo-s.fp16.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:25c5f673bb64853f01f3b77c87a85d51dd85f53f95ddd11fbcf635166e0e0391
-size 19869781

 version https://git-lfs.github.com/spec/v1
+oid sha256:5ff4fd6f14d9f5c7fe4b59896789debc5713a39f64f7ecf60bbb98ae59c75509
+size 19873230

rtmo-t.fp16.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:227a75f6b5b954f05cf595d2171013b97a1b885c512985590d077ff599502cd6
-size 13731720

 version https://git-lfs.github.com/spec/v1
+oid sha256:a4d4df491a850429f32e738ec3273aceecda9e08e034607e9ea2413270977b66
+size 13735169