sunblaze-ucb
/

Qwen3-14B-GRPO-MATH-1EPOCH

Text Generation

reinforcement-learning

text-generation-inference

Model card Files Files and versions

Qwen3-14B-GRPO-MATH-1EPOCH

Commit History

Create README.md

9493b90
verified

Xuandong commited on Jun 16

initial commit

8424ce3
verified

Xuandong commited on Jun 16