2imi9
/

gpt-oss-20B-NVFP4A16-BF16

Text Generation

post-training-quantization

Model card Files Files and versions

2imi9 commited on Aug 31

Commit

44368c3

·

verified ·

1 Parent(s): 7c2107a

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -53,7 +53,8 @@ model-index:
 This model is a quantized version of OpenAI's GPT-OSS-20B using NVIDIA's advanced NVFP4 format. It follows the official NVIDIA TensorRT Model Optimizer methodology, providing superior accuracy retention compared to MXFP4 quantization while maintaining significant memory efficiency gains.
 ## Blog
-Fine-Tuning gpt-oss for Accuracy and Performance with Quantization Aware Training:https://developer.nvidia.com/blog/fine-tuning-gpt-oss-for-accuracy-and-performance-with-quantization-aware-training/
 ## Key Features

 This model is a quantized version of OpenAI's GPT-OSS-20B using NVIDIA's advanced NVFP4 format. It follows the official NVIDIA TensorRT Model Optimizer methodology, providing superior accuracy retention compared to MXFP4 quantization while maintaining significant memory efficiency gains.
 ## Blog
+Fine-Tuning gpt-oss for Accuracy and Performance with Quantization Aware Training:
+https://developer.nvidia.com/blog/fine-tuning-gpt-oss-for-accuracy-and-performance-with-quantization-aware-training/
 ## Key Features