stellalisy
/

rethink_rlvr_reproduce-incorrect-qwen2.5_math_7b-lr5e-7-kl0.00-step50

Text Generation

text-generation-inference

Model card Files Files and versions

rethink_rlvr_reproduce-incorrect-qwen2.5_math_7b-lr5e-7-kl0.00-step50

15.2 GB

1 contributor

History: 3 commits

stellalisy's picture

Upload tokenizer

6d02f8d verified 6 months ago