huihui-ai
/

Huihui-gpt-oss-20b-mxfp4-abliterated

Text Generation

8-bit precision

Model card Files Files and versions

huihui-ai commited on Sep 14

Commit

ad5effe

·

verified ·

1 Parent(s): 915618e

Update README.md

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -20,6 +20,8 @@ This is a mxfp4 version of [huihui-ai/Huihui-gpt-oss-20b-BF16-abliterated](https
 Reference [OpenAI GPT-OSS Quantization Aware Training (QAT) & Quantized Deployment](https://github.com/NVIDIA/TensorRT-Model-Optimizer/blob/76e8ce21bf9ce4e0510fea96c998aaee7cfeaf7c/examples/gpt-oss/README.md)
 ```
 pip install nvidia-modelopt[all]

 Reference [OpenAI GPT-OSS Quantization Aware Training (QAT) & Quantized Deployment](https://github.com/NVIDIA/TensorRT-Model-Optimizer/blob/76e8ce21bf9ce4e0510fea96c998aaee7cfeaf7c/examples/gpt-oss/README.md)
+**This precision loss rate is high; fine-tuning through QAT may be needed to reduce the precision loss rate.**
 ```
 pip install nvidia-modelopt[all]