Models

72,144

Full-text search

Active filters: reinforcement-learning

nvidia/EGM-4B

Image-Text-to-Text • 5B • Updated 5 days ago • 83 • 5

zai-org/GLM-TTS

Text-to-Speech • Updated Jan 12 • 2.19k • 334

nvidia/GEAR-SONIC

Reinforcement Learning • Updated 4 days ago • 25

nvidia/EGM-8B

Image-Text-to-Text • 9B • Updated 5 days ago • 77 • 3

NousResearch/DeepHermes-ToolCalling-Specialist-Atropos

Reinforcement Learning • 8B • Updated Apr 28, 2025 • 14 • 16

Adilbai/stock-trading-rl-agent

Reinforcement Learning • Updated Jan 8 • 105 • 135

dunnolab/VintixII

Reinforcement Learning • Updated 6 days ago • 53 • 2

exla-ai/openpie-0.6

Robotics • Updated Feb 4 • 92 • 18

zlab-princeton/Vero-Qwen3T-8B

Image-Text-to-Text • 9B • Updated 8 days ago • 33 • 2

IntelligenceLab/COS-PLAY

Reinforcement Learning • Updated 7 days ago • 2

ValueFX9507/Tifa-DeepsexV3-14b-GGUF-Q6

Reinforcement Learning • 15B • Updated Jul 1, 2025 • 15.6k • 42

Arc-Intelligence/ATLAS-8B-Thinking

Text Generation • 8B • Updated Sep 12, 2025 • 34 • 5

JonusNattapong/AI-XAUUSD-Trading

Reinforcement Learning • Updated Oct 10, 2025 • 29

PRIME-RL/P1-235B-A22B

Text Generation • 235B • Updated Oct 24, 2025 • 30 • 20

chaseungjoon/wildfire-prediction-A3C-LSTM

Reinforcement Learning • Updated Dec 8, 2025 • 2 • 1

PrimeIntellect/INTELLECT-3.1

Text Generation • 107B • Updated Feb 18 • 270 • 42

AQ-MedAI/PulseMind-72B

Image-Text-to-Text • 73B • Updated Jan 30 • 14 • 1

Saminx22/qwen3-0.6B-rlvr-grpo

Reinforcement Learning • Updated Feb 21 • 1

XunmeiLiu/VFIG-4B

Reinforcement Learning • 4B • Updated 19 days ago • 389 • 5

zlab-princeton/Vero-Qwen3I-8B

Image-Text-to-Text • 9B • Updated 8 days ago • 49 • 1

batteryphil/mamba-2.8b-latent

Text Generation • 3B • Updated about 17 hours ago • 1.21k • 3

suuley/ppo-LunarLander-v2

Reinforcement Learning • Updated 8 days ago • 53 • 1

loisonchambers/ppo-PyramidsTraining

Reinforcement Learning • Updated 6 days ago • 77 • 1

vivekvish2004/openenv-customer-support

Reinforcement Learning • Updated 2 days ago • 1

zapqqqwe/videopro_grpo

Reinforcement Learning • 9B • Updated 3 days ago • 34 • 1

Accio-Lab/Metis-8B-RL

Image-Text-to-Text • 9B • Updated 4 days ago • 39 • 1

JosedelaPepe/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated 4 days ago • 1

hongli-zhan/MINT-empathy-Qwen3-1.7B

Text Generation • 2B • Updated 4 days ago • 501 • 1

hongli-zhan/MINT-empathy-Qwen3-4B

Text Generation • 4B • Updated 4 days ago • 491 • 1

yssnn04/ppo-LunarLander-v3

Reinforcement Learning • Updated 3 days ago • 46 • 1