sunblaze-ucb
/

Qwen3-14B-GRPO-MATH-1EPOCH

Text Generation

reinforcement-learning

text-generation-inference

Model card Files Files and versions

Qwen3-14B-GRPO-MATH-1EPOCH

2.07 kB

2 contributors

History: 2 commits

Xuandong's picture

Create README.md

9493b90 verified 5 months ago