sunblaze-ucb
/

Qwen3-14B-GRPO-MATH-1EPOCH

Text Generation

reinforcement-learning

text-generation-inference

Model card Files Files and versions

Qwen3-14B-GRPO-MATH-1EPOCH

1.52 kB

2 contributors

History: 1 commit

Xuandong's picture

initial commit

8424ce3 verified 6 months ago

.gitattributes

1.52 kB

initial commit 6 months ago