Qwen2.5-1.5B-countdown-R3 / README.md

Upload README.md with huggingface_hub

16e2d0b verified 6 months ago

419 Bytes

metadata

library_name: transformers
pipeline_tag: text-generation
base_model:
  - Qwen/Qwen2.5-1.5B

UFT

## References

* [UFT: Unifying Supervised and Reinforcement Fine-Tuning](https://arxiv.org/abs/2505.16984)